Question

您好我使用simple_html_dom查找html文档中属于“new”类的每个链接。通常我会用：

  $html->find('a[class=new]');

这将获得诸如例如

之类的链接

<a class="new" ... blah blah ... />

这次问题是html文档包含与

等类的链接

<a class="today new".../>
<a class="alksdjld new kfljslfd".../>

基本上很多其他链接都带有新词。在线手册说[class ^ = new]将部分地解决这个问题，因为它对以START开头的类进行排序，并确实有效。但这仍然留下像“新等等等等”的课程

希望这是有道理的。有没有人遇到这个/解决了这个？

Answer 1

一旦你找到使用[class ^ = new]的整个类列表，你可以循环遍历它们并过滤那些只有一个新类作为它们唯一的类吗？

Answer 2

来自文档：

// Find all <li> in <ul>
foreach($html->find('ul') as $ul)
{
       foreach($ul->find('li') as $li)
       {
             // do something...
       }
}

所以你应该能够遍历你的记录并查看$ a-＆gt;类以查看它是否= ='new'，否则它将不仅仅是新的，你可以跳过它。 ..

php解析与simple_html_dom，搜索问题

2 个答案: