什么归类为html标签上的Child?

时间:2015-02-18 06:03:34

标签: php html parsing curl domdocument

我想解析这个并且需要知道孩子的数量。我被告知,评论也应该算作儿童。我很困惑,计算父母内部的所有标签作为孩子吗?

<div class="event">
                <h4>Northland Outdoors Duluth Deer Classic</h4>
                <span class="timestamp" style="display: none;">1424282400</span>        
                <p class="date"><span class="month">February</span> 18, <span class="year">2015</span>  </p>    <table><tr><td class="field-name">Location:</td>
                <td class="location">
                    <span class="city">Duluth</span>, 
                    <span class="state">MN</span>, Duluth Entertainment Convention Center</td><td><tr><td class="field-name">Description:</td><td>Join us at the Northland Outdoors Duluth Deer Classic February 18th - 20th, 2015, which will again be held in conjunction...
                <a href="/events/details/northland-outdoors-duluth-deer-classic2" title="View listing detail">View more detail &raquo;</a></td></tr><tr><td class="field-name">Types of Vendor:</td><td>
                <ul class="vendors"><li class="allowed art">Art</li><li class="allowed craft">Craft</li><li class="allowed commercial">Commercial</li></ul>         </td></tr></table><div class="clear"></div></div>

1 个答案:

答案 0 :(得分:0)

一旦你通过DOM / Curl解析事件类,它就会将String转换为节点对象。对象被调用到所有断点,即。要么 。 每个节点还可以包含其他子节点,例如

<div class= 'event'> <p class='class2'>something here</p></div>

在这种格式中,class2是类事件的子类或子类。解析html的最佳方法是按类名或href查找(搜索)...并且不要使用直接路径到目标部分。它在解析时更安全有效。 另一方面,识别孩子的最佳方法是计算直接/主要开始和结束部分< ></>