我正试图从一个新闻网站获取一些数据。要做到这一点,我需要使用网站的内部搜索引擎。我认为获取javascript生成的内容存在一些问题吗?
import mechanize
br = mechanize.Browser()
search_for = 'stack'
url = 'http://www.delfi.lt/paieska/?q={}'.format(search_for)
htmlfile = br.open(url)
webtext = htmlfile.read()
print webtext
我发现这将返回包括搜索结果在内的所有文本。但是,它不会返回搜索结果。
我被投了票。没关系,但请提供反馈,我的问题出了什么问题。
答案 0 :(得分:1)
他们正在使用通过javascript加载的自定义Google搜索。您有三种选择:
你真的不能使用机械化来完成这些任务。