Question

我试图从HTML页面解析一些信息。唯一的问题是我需要的信息不在标签中，因此无法轻易找到。以下是我所谈论的一个例子。

<span class="fieldlabeltext">Levels: </span>Undergraduate 
<br>
<span class="fieldlabeltext">Attributes: </span>Online Course 
<br>
<span class="fieldlabeltext">Instructors: </span>N/A
<br>

我需要提取＆＃34;在线课程＆＃34;从上面的例子中，但不是所有的＆＃34;属性＆＃34;在整个HTML文件中都是相同的。所以有些可能是＆＃34;批判性思维＆＃34;或者＆＃34; Capstone＆＃34;以及更多其他游戏。提取这些数据的最佳方法是什么？我正在使用PHP Simple HTML DOM Parser - http://simplehtmldom.sourceforge.net/

Answer 1

Marc B的评论是正确的。 SimpleHTMLDOM具有以下功能，您可以对元素执行以实现所需的功能。

element $e->parent() - 返回元素的父级。
element $e->first_child() - 返回元素的第一个子元素，如果未找到则返回null。
element $e->last_child() - 返回元素的最后一个子元素，如果未找到则返回null。
element $e->next_sibling() - 返回元素的下一个兄弟，如果没有找到则返回null。
element $e->prev_sibling() - 返回元素的上一个兄弟，如果未找到则返回null。

来源：http://simplehtmldom.sourceforge.net/manual.htm#section_traverse

PHP解析器：HTML标签后解析HTML文本

1 个答案: