通过使用for循环

时间:2018-02-13 22:15:26

标签: python html url web-scraping iteration

我试图从特定酒店的tripadvisor中获取数据。

tripadvisor中酒店的URL是

https://www.tripadvisor.com/Hotel_Review-g39143-d92240-Reviews-Hawthorn_Suites_by_Wyndham_Wichita_East-Wichita_Kansas.html

在" d92240-Reviews"之后出现页面分隔符用键" -or5 - "当页面返回5条评论时,以5的倍数。

例如

https://www.tripadvisor.com/Hotel_Review-g39143-d92240-Reviews-or5-Hawthorn_Suites_by_Wyndham_Wichita_East-Wichita_Kansas.html

https://www.tripadvisor.com/Hotel_Review-g39143-d92240-Reviews-or10-Hawthorn_Suites_by_Wyndham_Wichita_East-Wichita_Kansas.html

网页以&#34结尾;& start =(结果数)"我可以创建一个for循环来返回每个页面

for i in range(0,200,5):
  url = http://blahblahblah&start= + str(i)

但是,我不知道如何使用tripadvisor网址。

1 个答案:

答案 0 :(得分:1)

你走了:

module_a