PHP简单的HTML DOM解析器,用于生成源代码"

时间:2014-04-14 10:39:50

标签: javascript php parsing dom

根据我的理解,每页有两种类型的源代码(Generated Source code VS Source Code(如What is the difference between "Source" and "Generated Source"?中所述)。

当我使用PHP Simple HTML DOM Parser(http://simplehtmldom.sourceforge.net/)时,我注意到我只能得到Source Code

如何获得Generated Source code

如果无法使用PHP Simple HTML DOM Parser,还有其他方法可以使用PHP来获取Generated Source code吗? (可选)

如果使用PHP无法获取Gebnerated Source code,是否还有其他方法可以使用javascript来获取它? (可选)

更新1 :参考用户Shankar Damodaran的回答,我需要更改我的理解,即有三种类型的源代码,如下所示:

  • 实际源代码(例如PHP,ASPX。通常适用于服务器端脚本)

  • 源代码(应用javascript和css之前的源代码)

  • 生成的源代码(应用javascript和css后的源代码)

2 个答案:

答案 0 :(得分:1)

您无法单独使用PHP,您必须依赖SeleniumPhantom.js,这些无头浏览器将呈现页面并返回给您您正在寻找的HTML结构。

答案 1 :(得分:0)

我觉得你误解了..

源代码 由服务器解释 生成的源代码 是返回给浏览器的代码。 (只是HTML的东西

HTML DOM解析器的作用是使用 生成的源代码 而不是实际的 源代码

回答你的问题......

  

如何获取生成的源代码?

除非是非法手段,否则您无法获得实际源代码