我有一个html网页网址http://teluguone.com/recipes/content/Andhra-Spicy-Mutton-Curry-Recipe-6-221.html
我需要从上面的网址中提取描述文字。
我的要求是,我需要在多个DIV标签之间使用html标签获取文本
示例:
<div class="relatedarticals_info_bold"><h1>Recipe Name</h1></div> : Andhra Spicy Mutton Curry Recipe</div>
</div> <div id="relatedarticals_info2"> <div class="relatedarticals_info"> <div class="relatedarticals_info_bold">
<h1>Author</h1></div> : Teluguone</div> </div> <div id="relatedarticals_info2"> <div class="relatedarticals_info">
<div class="relatedarticals_info_bold"><h1>Preparation Time</h1></div> : 30 Mins</div> </div>etc.....?
我需要得到这样的输出:
Recipe Name: Andhra Spicy Mutton Curry Recipe Author: Teluguone
Preparation Time: 30 Mins etc...
答案 0 :(得分:2)
如果HTML以字符串形式提供,您可以使用jQuery的$.parseXML
,如果成功解析(格式良好的HTML),它将转换为XMLDocument
。
然后可以使用.find()
,.parent()
和其他此类遍历方法遍历和操作此对象。
注意:当然,假设您愿意在客户端执行此操作。