我想解析这个并且需要知道孩子的数量。我被告知,评论也应该算作儿童。我很困惑,计算父母内部的所有标签作为孩子吗?
<div class="event">
<h4>Northland Outdoors Duluth Deer Classic</h4>
<span class="timestamp" style="display: none;">1424282400</span>
<p class="date"><span class="month">February</span> 18, <span class="year">2015</span> </p> <table><tr><td class="field-name">Location:</td>
<td class="location">
<span class="city">Duluth</span>,
<span class="state">MN</span>, Duluth Entertainment Convention Center</td><td><tr><td class="field-name">Description:</td><td>Join us at the Northland Outdoors Duluth Deer Classic February 18th - 20th, 2015, which will again be held in conjunction...
<a href="/events/details/northland-outdoors-duluth-deer-classic2" title="View listing detail">View more detail »</a></td></tr><tr><td class="field-name">Types of Vendor:</td><td>
<ul class="vendors"><li class="allowed art">Art</li><li class="allowed craft">Craft</li><li class="allowed commercial">Commercial</li></ul> </td></tr></table><div class="clear"></div></div>
答案 0 :(得分:0)
一旦你通过DOM / Curl解析事件类,它就会将String转换为节点对象。对象被调用到所有断点,即。要么 。 每个节点还可以包含其他子节点,例如
<div class= 'event'> <p class='class2'>something here</p></div>
在这种格式中,class2是类事件的子类或子类。解析html的最佳方法是按类名或href查找(搜索)...并且不要使用直接路径到目标部分。它在解析时更安全有效。
另一方面,识别孩子的最佳方法是计算直接/主要开始和结束部分< ></>