我试图从HTML页面解析一些信息。唯一的问题是我需要的信息不在标签中,因此无法轻易找到。以下是我所谈论的一个例子。
<span class="fieldlabeltext">Levels: </span>Undergraduate
<br>
<span class="fieldlabeltext">Attributes: </span>Online Course
<br>
<span class="fieldlabeltext">Instructors: </span>N/A
<br>
我需要提取&#34;在线课程&#34;从上面的例子中,但不是所有的&#34;属性&#34;在整个HTML文件中都是相同的。所以有些可能是&#34;批判性思维&#34;或者&#34; Capstone&#34;以及更多其他游戏。提取这些数据的最佳方法是什么?我正在使用PHP Simple HTML DOM Parser - http://simplehtmldom.sourceforge.net/
答案 0 :(得分:1)
Marc B的评论是正确的。 SimpleHTMLDOM具有以下功能,您可以对元素执行以实现所需的功能。
element $e->parent()
- 返回元素的父级。element $e->first_child()
- 返回元素的第一个子元素,如果未找到则返回null。element $e->last_child()
- 返回元素的最后一个子元素,如果未找到则返回null。element $e->next_sibling()
- 返回元素的下一个兄弟,如果没有找到则返回null。element $e->prev_sibling()
- 返回元素的上一个兄弟,如果未找到则返回null。来源:http://simplehtmldom.sourceforge.net/manual.htm#section_traverse