根据我的理解,每页有两种类型的源代码(Generated Source code
VS Source Code
(如What is the difference between "Source" and "Generated Source"?中所述)。
当我使用PHP Simple HTML DOM Parser(http://simplehtmldom.sourceforge.net/)时,我注意到我只能得到Source Code
。
如何获得Generated Source code
?
如果无法使用PHP Simple HTML DOM Parser,还有其他方法可以使用PHP来获取Generated Source code
吗? (可选)
如果使用PHP无法获取Gebnerated Source code
,是否还有其他方法可以使用javascript来获取它? (可选)
更新1 :参考用户Shankar Damodaran
的回答,我需要更改我的理解,即有三种类型的源代码,如下所示:
实际源代码(例如PHP,ASPX。通常适用于服务器端脚本)
源代码(应用javascript和css之前的源代码)
生成的源代码(应用javascript和css后的源代码)
答案 0 :(得分:1)
您无法单独使用PHP,您必须依赖Selenium或Phantom.js,这些无头浏览器将呈现页面并返回给您您正在寻找的HTML结构。
答案 1 :(得分:0)
源代码 由服务器解释 生成的源代码 是返回给浏览器的代码。 (只是HTML的东西)
HTML DOM解析器的作用是使用 生成的源代码 而不是实际的 源代码。 强>
如何获取生成的源代码?
除非是非法手段,否则您无法获得实际源代码。