Python在浏览器中看到http:html页面 - 带有javascripts结果

时间:2016-05-23 19:10:44

标签: javascript python http

我是否可以在浏览器中看到http页面 - 在javascripts运行后完全形成?无需提交数据和按下按钮。恕我直言它的标准任务,我在哪里可以看到运行所有脚本并获得结果的示例?

经:

u = urllib.request.urlopen('https://www.*')
data = u.read()

如果我在浏览器中选择了查看源,我会看到页面。但是,当我检查页面上的元素时,我会看到代码是如何扩展的,例如:

<div class="js-events-container"></div>

扩展为:

<div class="js-events-container">    <table class="zebra noBorderTbl" style="width: 100%;">
        <tbody><tr>
            <th>1</th>
            <th>2</th>
            <th>3</th>
        </tr>
...
        </tr>
            </tbody></table>
</div>

3 个答案:

答案 0 :(得分:1)

我在类名中看到js,它可能是javascript,我认为没有办法用urllib获取整个页面。你需要在javascript启动后拉网站。你需要硒或幻影来完成这项工作。

答案 1 :(得分:0)

您还可以查看此特定库dryscape。根据文档,它可以识别javascript。

答案 2 :(得分:0)

我现在使用selenium加载页面,然后获取page_source。尽管有名称,但page_source不提供页面源,而是在运行java脚本后提供页面结果。