使用Python抓取TripAdvisor饭店页面

时间:2018-09-19 14:05:22

标签: python scrape tripadvisor

我目前正在制作刮板,以获取评论和评分。

可以在餐厅使用,但在酒店可以给我400欧元

代码如下:https://gist.github.com/jamieaitken/e6df15db9f1204fe67c16f1404996c6f

感谢任何帮助,谢谢

2 个答案:

答案 0 :(得分:1)

嗯,为什么urlNotWork和urlWorks没有用字符串括起来?

答案 1 :(得分:0)

嗯,常规请求在这里应该可以正常工作,例如:

from requests import request as req

url = 'https://www.tripadvisor.co.uk/Hotel_Review-g60745-d121009-Reviews-Holiday_Inn_Express_Boston-Boston_Massachusetts.html'
rsp = req('GET', url)

if rsp.status_code == 200:
    print(rsp.text.encode('utf-8'))