php解析与simple_html_dom,搜索问题

时间:2009-10-27 00:35:06

标签: php parsing

您好我使用simple_html_dom查找html文档中属于“new”类的每个链接。通常我会用:

  $html->find('a[class=new]'); 

这将获得诸如例如

之类的链接
<a class="new" ... blah blah ... />

这次问题是html文档包含与

等类的链接
<a class="today new".../>
<a class="alksdjld new kfljslfd".../>

基本上很多其他链接都带有新词。在线手册说[class ^ = new]将部分地解决这个问题,因为它对以START开头的类进行排序,并确实有效。但这仍然留下像“新等等等等”的课程

希望这是有道理的。有没有人遇到这个/解决了这个?

2 个答案:

答案 0 :(得分:1)

一旦你找到使用[class ^ = new]的整个类列表,你可以循环遍历它们并过滤那些只有一个新类作为它们唯一的类吗?

答案 1 :(得分:0)

来自文档:

// Find all <li> in <ul>
foreach($html->find('ul') as $ul)
{
       foreach($ul->find('li') as $li)
       {
             // do something...
       }
}

所以你应该能够遍历你的记录并查看$ a-&gt;类以查看它是否= ='new',否则它将不仅仅是新的,你可以跳过它。 ..