我是Python的新手,并且已经请求从www.skyscanner.net
获取动态数据。
有人可以指导我这样做吗?
import requests
import lxml.html as lh
url = 'http://www.skyscanner.net/transport/flights/sin/lhr/131231/140220/'
response = requests.post(url)
tree = lh.document_fromstring(response.content)
print(tree);
我所做的只是在URL中找到模式并尝试从那里抓取。但是,没有成功提取数据。我了解到Python是执行此类任务的最佳语言,但是库看起来太大了,我不知道从哪里开始。
答案 0 :(得分:0)
我的名字是Piotr - 我在Skyscanner工作 - 在数据采集团队 - 我认为你申请加入:-)因为这是你的任务的一部分,我不想给你一个直接的答案,但是你可能会考虑:
我认为这就是我所能说的:-)
干杯, 彼得