我一直在尝试对HTML文档进行一些简单的DOM解析,并且对于它的执行难度感到非常震惊。
我已经研究了PHP的DOM类的许多替代方法(如simple xml parser和simple HTML DOM)。我发现了一个非常有效的dom2array function,这对于你只想要元素原始值的极其基本的解析非常有用。
这些替代品中没有一个真的令人信服。
PHP documentation of the DOM通常缺乏细节,而且基本上没用。很多评论实际上确实很有帮助。
我在网上找到的教程通常只涵盖非常基础知识,例如编写20行XML文档或解析文档中的所有p标记。 MEH。
是否有任何网站(或书籍)详细介绍了使用PHP的DOM库使用DOM的具体细节?
答案 0 :(得分:1)
DOM是一种与语言无关的界面,documented in detail by the W3C。
话虽这么说,如果您的目标是(通常)结构化信息的解析非常简单,那么XML可能不是正确的格式; XML包括各种高级功能(名称空间,DTD,XSLT,属性和文本之间的区别,标记而不是结构化信息)。如果是这种情况,请考虑JSON,extremely easy to parse和generate。
答案 1 :(得分:0)
在名称中声明“DOM”或声称支持它的任何内容都应支持the DOM API as defined by the W3C,并且除了特定于语言的部分之外,您应该考虑其文档的规范性。
答案 2 :(得分:0)
我应该标题我的帖子,“用PHP解析HTML DOM的最简单方法”。我知道,'最简单'不是一个很好的词。这都与你想要做的事情有关。我正在做的事情很简单。我想解析独立的HTML文档并在不同的上下文中呈现内容。
这些是我想要做的事情:
我最终选择了Simple HTML DOM Parser
它具有非常小的学习曲线,可以轻松读取/写入DOM。故事结局。它有时似乎会阻塞嵌套元素。