这是我的代码片段
import gtk, webkit
window = gtk.Window()
browser = webkit.WebView()
url = "www.google.com"
browser.open(url)
现在我想获得网页标题,里面的脚本标签。那我该怎么办呢?
文档在这些方面并不清楚,我只找到了Objective-C的文档,我正试图找到自己的方式。如果你知道我在哪里可以得到更好的参考,不一定是Python。 C,C ++也没关系。
谢谢
2 个答案:
答案 0 :(得分:1)
我认为以下内容应该有效(我现在无法尝试):
def title_changed(widget, frame, title):
print title
browser.connect('title-changed', title_changed)
有一些文档here和here以及来自源tarball的demo目录中的两个示例。
答案 1 :(得分:0)
它不受用于检索html的技术的约束。一旦浏览器打开它,只需用漂亮的汤或任何支持XPath的东西解析html。