我正在尝试使用name
标签抓取数据。我要整理标题和内容。
例如
<div style="background-color:#275aa0; color:#fff; padding-left:10px; padding-top:3px; padding-bottom:3px; font-size:15px; font-weight:400;">
<a name="18" class="anchor"></a>head1
</div>
<p>
<strong><span class="faq_title">Text1</span></strong>
</p>
<p>
<strong><span class="faq_title">Text n...</span></strong>
</p>
/* Next content */
<div style="background-color:#275aa0; color:#fff; padding-left:10px; padding-top:3px; padding-bottom:3px; font-size:15px; font-weight:400;">
<a name="19" class="anchor"></a>head2
</div>
<p>
<strong><span class="faq_title">Text1</span></strong>
</p>
<p>
<strong><span class="faq_title">Text n...</span></strong>
</p>
如果我要抓取name="18"
name="19"
,这里的title
和p
是content
标签。
我想这样组织数据:
head1
|_Text1
:
:
|_Text n
head2
|_Text1
:
:
|_Text n