我试图了解简单加载页面的结果与QtWebkit和wget
命令之间的区别,除了QtWebkit有一个大型API,我们可以在网页中使用它来做很多东西都用Python。
wget
的过程是什么?如何下载包含其所有组件(图片等)的网页。两个流程的输出大小是否存在差异?
最后一个问题:在QtWebkit的加载页面中执行什么(javascript)(除onload
事件处理程序外)?
答案 0 :(得分:1)
默认情况下,wget不会检索任何页面必需品,除非您通过-p
/--page-requisites
or the -r
/--recursive
flags告诉它。它不处理任何JavaScript命令,也不会尝试对标记或CSS执行任何操作,除非您明确指出。即便如此,我很确定它只是使用简单的字符串匹配来确定资源名称和链接URL。总而言之,在你正确配置它之前它是非常愚蠢的(几乎每个强大的* NIX工具的基础)。
由于WebKit库非常广泛,因此了解您尝试使用它的方式很有用,例如您正在执行的代码。但是,既然你已经知道你在做什么就是执行JavaScript调用,那么可以合理地假设它不仅仅是检索页面。
也许如果你举一些你想要做的例子,我就能更彻底地回答你的问题。