我一直在网上搜索以下问题的答案,而我缺乏成功可能与我在网络编程/ html方面缺乏经验有关。如果是这样,并且有一个明显的答案,抱歉打扰你们。我一直在尝试从网站上解析一堆文本,我发现了python脚本html2text.py,它能够以我能解析的方式呈现网站。但是,为了获取所有信息,我需要访问网站上的下拉菜单。下拉菜单控制显示哪一年的数据,我希望获得所有可用年份。我已经看到使用urllib2我可以访问一个网站,看起来我也可以向网站发送信息,但我还没弄清楚如何操作下拉菜单。我感兴趣的网站是http://www.nfldata.com/nfl-stats/team-stats.aspx,如果这有帮助的话。提前感谢您提供的任何建议。
-Matt
答案 0 :(得分:1)
查看python中的xml库。您可以获取原始html文本并将其解析为文档对象模型(DOM)接口:
答案 1 :(得分:1)
您所看到的不是“下拉菜单”,而是“选择”小部件。
您应该能够解析它,并找到所有<option value="X">name<option>
个条目。 X就是你所需要的。