我有一个html页面的源代码,我想要做的是从中提取选择性信息。例如,源代码中包含:
<div class="date">
<strong>Date:</strong> 03/04/2015 </div>
我要提取的是'日期:03/04/2015'
或者这个:
<div class="name">
<strong>Name:</strong> <a href = 'http://www.example.com' title='Title'>Jhon Smit</a >
我想提取'Jhon Smit' ,这个操作对于页面中的很多东西。有没有快速的方法来做到这一点?