我在很长一段时间内遇到了问题。不幸的是我无法找到我自己的解决方案,所以我必须在这里发布我的问题。
我正在编写一个php脚本,用于从动态创建的HTML文件中创建PDF文件。
现在,我想“解析”html文件,然后对HTML中的下一个标记进行操作。
E.g。
<div><p>Test</p></div>
我的脚本应该识别:
第一个标签是div:为div执行功能 第二个标签是p:do函数p
我不知道应该搜索什么。常用表达? HTML解析器?
感谢您的提示!
答案 0 :(得分:0)
尝试使用XML解析器。在PHP中SimpleXML
可能就是你要找的东西。
答案 1 :(得分:0)
我曾多次使用phpQuery。这是一个很好的解决方案,虽然它很大并且似乎不再受支持(最后提交> 10个月)。
答案 2 :(得分:-1)
您需要做的是将HTML
文件读入PHP variable/object
http://www.php-mysql-tutorial.com/wikis/php-tutorial/read-html-files-using-php.aspx
然后使用RegEx
来解析HTML Tags
和Attributes
http://www.codeproject.com/Articles/297056/Most-Important-Regular-Expression-for-parsing-HTML