基本上我需要从amazon.com获取数据,例如产品及其价格,仅用于查看数据库设计,然后将它们插入到sql表中。
但是我应该如何继续获取和解析数据......
任何人都可以引导我找到正确的方向,甚至可以告诉我这个问题涉及的合法性。
非常感谢...
答案 0 :(得分:1)
要解析HTML,您需要使用Beautiful Soup之类的东西:
http://www.crummy.com/software/BeautifulSoup/
要下载HTML,请使用包含在Python标准库中的urllib或urllib2。
对于法律术语,请咨询律师。但标准库确实包含一个robotsparser库,用于解析robots.txt,这通常是你应该做的事情。
答案 1 :(得分:0)
有几个用于查询亚马逊产品数据的Python库:
对于法律术语阅读Amazon.com Product Advertising API License Agreement并与律师交谈。