我通过CURL请求获取数据,并且在解析HTML时,有些属性的跨度没有得到整齐解析。
HTML代码片段
<div class="ftlt" style="width:250px;">
<div class="tdiv"><span class="prop_price_img"></span><span class="property_price">PROPERTY_PRICE</span></div>
<p class="adPrice">AREA</p>
<h4>
<p style="float:left;width:251px;font-family:Arial, Helvetica, sans-serif;font-size:13px;padding:2px 10px 10px 0px;"><a href="some link" title="title">TITLE</a>,
<span style="color:#666;"> CITY_NAME.</span>
<a title="title, Sale" style="color:#3266CC;font-size:12px;text-decoration:underline;">View on map</a></p>
</h4>
<p style="font-weight:bold;color:#666;">
Premium
</p>
<div class="clr"></div>
</div>
我必须整齐地访问CITY_NAME元素。 我已经能够通过HTML DOM获取该节点
$spans = $html->find(div.ftlt span);
$city_value=strip_tags($spans[2]);
此$city_value
正在变形。
我尝试过removeAttribute方法。也许我没有做好。
如果可以应用正则表达式,我想知道怎么做?
答案 0 :(得分:0)
$spans = $html->find(div.ftlt span);
$city_value=$spans[2]->nodeValue;
为什么不使用nodeValue?