从html页面中提取类内容

时间:2015-05-19 20:50:10

标签: html class extract

我有一个html页面的源代码,我想要做的是从中提取选择性信息。例如,源代码中包含:

 <div class="date">
 <strong>Date:</strong> 03/04/2015 </div>

我要提取的是'日期:03/04/2015'

或者这个:

<div class="name">
    <strong>Name:</strong> <a href = 'http://www.example.com' title='Title'>Jhon Smit</a > 

我想提取'Jhon Smit' ,这个操作对于页面中的很多东西。有没有快速的方法来做到这一点?

1 个答案:

答案 0 :(得分:2)

使用元素的textContent属性。

顺便说一句,collect列表更适合标记这类内容:

DL