刮火车票价

时间:2013-06-28 21:21:10

标签: web-scraping

我正在寻找建议。以下网站

http://brfares.com/#home

提供英国列车线路的票价信息。我想用它来建立一个来自不同地点的季票的旅行费用数据库。我以前从未做过这样的事情,但有Python / Bash脚本和一些HTML的经验。

查看典型查询的源代码,index.html中不会显示实际的公平信息。任何人都可以提供一个指针,指示如何抓取信息(对我来说是一个新词)。

1 个答案:

答案 0 :(得分:1)

这是查询的网址:http://brfares.com/querysimple?orig=SUY&dest=0415&rlc=

响应是一个json对象。

首先,您需要构建所有目标代码的查找表。您可以使用以下链接执行http://brfares.com/ac_loc?term=。对字母表中的所有字母执行此操作,然后解析唯一列表。

然后你把它们拿走,执行json查询,解析返回的json并将数据提供给数据库。

现在,您可以使用该数据库执行任何操作。