我想知道哪种编程语言提供了大量的库来编写Web机器人? 像抓取网页上的数据一样。说我想为weather.yahoo.com网站获取天气。
对于AI桌面机器人,答案也一样吗?
答案 0 :(得分:10)
以下是在Python中如何做到这一点:
from urllib2 import urlopen
from BeautifulSoup import BeautifulSoup
soup=BeautifulSoup(urlopen("http://weather.yahoo.com/").read())
for x in soup.find(attrs={"id":"myLocContainer"}).findAll("li"):
print x.a["title"], x.em.contents
打印:
芝加哥,伊利诺伊州,美国(Haze)[u'35 ... 47°F']的完整预测 完整预测伦敦,大伦敦,英格兰(小雨)[u'43 ... 45°F'] 全面预测纽约,纽约,美国(部分多云)[u'42 ... 62°F'] 美国加利福尼亚州旧金山的全面预测(部分多云)[u'51 ... 70°F']
答案 1 :(得分:3)
我不知道它是最好的,但是 Python 对于它来说绝对是非常好和简单的。
答案 2 :(得分:1)
另一个用于屏幕抓取和网络抓取的优秀python库是scrapy。