我对编码一无所知,并且刚刚开始学习!我和我的团队被分配了从网站抓取数据的任务:
要从Hotels.com(新加坡)获取数据,并提供诸如地址,姓名和等级(星级)之类的信息。
我们在课堂上了解到,有一个程序(Beautiful Soup)可以让我们抓取信息,但是我们仅设法完成了一页(但是有多个条目,大约700多个),我们无法捕获它。 。
任何善良的灵魂都可以通过在python上使用漂亮的汤来帮助所需的代码,以爬取数据,然后最终将其导出到CSV文件?然后我们将其转换为Tableu支持的XML文件以进行可视化。
非常感谢你们的帮助和智慧。 :)
使用了漂亮的汤,但只能检索到有限的条目
```import requests
```page_link = 'https://sg.hotels.com/search.do?resolved-location=COUNTRY%3A10233154%3AUNKNOWN%3AUNKNOWN&f-bed-type=1&destination-id=10233154&q-destination=Singapore&q-check-in=2020-04-14&q-check-out=2020-04-15&q-rooms=1&q-room-0-adults=2&q-room-0-children=0'
Expected results would preferably be a csv entry with 3 columns (Name, Address and Rating)