PHP解析器:HTML标签后解析HTML文本

时间:2012-03-16 18:28:35

标签: php html parsing dom

我试图从HTML页面解析一些信息。唯一的问题是我需要的信息不在标签中,因此无法轻易找到。以下是我所谈论的一个例子。

<span class="fieldlabeltext">Levels: </span>Undergraduate 
<br>
<span class="fieldlabeltext">Attributes: </span>Online Course 
<br>
<span class="fieldlabeltext">Instructors: </span>N/A
<br>

我需要提取&#34;在线课程&#34;从上面的例子中,但不是所有的&#34;属性&#34;在整个HTML文件中都是相同的。所以有些可能是&#34;批判性思维&#34;或者&#34; Capstone&#34;以及更多其他游戏。提取这些数据的最佳方法是什么?我正在使用PHP Simple HTML DOM Parser - http://simplehtmldom.sourceforge.net/

1 个答案:

答案 0 :(得分:1)

Marc B的评论是正确的。 SimpleHTMLDOM具有以下功能,您可以对元素执行以实现所需的功能。

  • element $e->parent() - 返回元素的父级。
  • element $e->first_child() - 返回元素的第一个子元素,如果未找到则返回null。
  • element $e->last_child() - 返回元素的最后一个子元素,如果未找到则返回null。
  • element $e->next_sibling() - 返回元素的下一个兄弟,如果没有找到则返回null。
  • element $e->prev_sibling() - 返回元素的上一个兄弟,如果未找到则返回null。

来源:http://simplehtmldom.sourceforge.net/manual.htm#section_traverse