PHP DOM的良好,可靠的文档

时间:2012-07-24 23:02:24

标签: php dom

我一直在尝试对HTML文档进行一些简单的DOM解析,并且对于它的执行难度感到非常震惊。

我已经研究了PHP的DOM类的许多替代方法(如simple xml parsersimple HTML DOM)。我发现了一个非常有效的dom2array function,这对于你只想要元素原始值的极其基本的解析非常有用。

这些替代品中没有一个真的令人信服。

PHP documentation of the DOM通常缺乏细节,而且基本上没用。很多评论实际上确实很有帮助。

我在网上找到的教程通常只涵盖非常基础知识,例如编写20行XML文档或解析文档中的所有p标记。 MEH。

是否有任何网站(或书籍)详细介绍了使用PHP的DOM库使用DOM的具体细节?

3 个答案:

答案 0 :(得分:1)

DOM是一种与语言无关的界面,documented in detail by the W3C

话虽这么说,如果您的目标是(通常)结构化信息的解析非常简单,那么XML可能不是正确的格式; XML包括各种高级功能(名称空间,DTD,XSLT,属性和文本之间的区别,标记而不是结构化信息)。如果是这种情况,请考虑JSONextremely easy to parsegenerate

答案 1 :(得分:0)

在名称中声明“DOM”或声称支持它的任何内容都应支持the DOM API as defined by the W3C,并且除了特定于语言的部分之外,您应该考虑其文档的规范性。

答案 2 :(得分:0)

我应该标题我的帖子,“用PHP解析HTML DOM的最简单方法”。我知道,'最简单'不是一个很好的词。这都与你想要做的事情有关。我正在做的事情很简单。我想解析独立的HTML文档并在不同的上下文中呈现内容。

这些是我想要做的事情:

  • 解析标题和正文等基本属性
  • 更改所有文件引用(图像,链接,css,js)以指向有效位置
  • 在标签中添加/删除属性(在此处理1995 HTML)
  • 剥离内联样式

我最终选择了Simple HTML DOM Parser

它具有非常小的学习曲线,可以轻松读取/写入DOM。故事结局。它有时似乎会阻塞嵌套元素。