如何在PHP中“读取”HTML文档?

时间:2012-03-07 15:56:13

标签: php html parsing

我在很长一段时间内遇到了问题。不幸的是我无法找到我自己的解决方案,所以我必须在这里发布我的问题。

我正在编写一个php脚本,用于从动态创建的HTML文件中创建PDF文件。

现在,我想“解析”html文件,然后对HTML中的下一个标记进行操作。

E.g。

<div><p>Test</p></div>

我的脚本应该识别:

第一个标签是div:为div执行功能 第二个标签是p:do函数p

我不知道应该搜索什么。常用表达? HTML解析器?

感谢您的提示!

3 个答案:

答案 0 :(得分:0)

尝试使用XML解析器。在PHP中SimpleXML可能就是你要找的东西。

答案 1 :(得分:0)

我曾多次使用phpQuery。这是一个很好的解决方案,虽然它很大并且似乎不再受支持(最后提交> 10个月)。

答案 2 :(得分:-1)