我想知道是否有任何方法可以从这样的代码中提取:
<div class="container ">
<h2 class="job">
<a href="/work/android-developer/madrid/11537332" rel="nofollow"
title="job Android Developer" class="job-offer ">
Android Developer
</a>
</h2>
<h3 class="company">
<a href="/emp/nbc/133192">
NBC Corp.
</a>
</h3>
</div>
文字Android developer
和NBC Corp.
一次拍摄?
像doc.select("h2,h3.p-job-title,p-name-company a[href]");
这样的东西不起作用。我也尝试了doc.select("h2.p-job-title a[href], h3.p-name company a[href]");
需要帮助!
编辑:我发现使用doc.select("h2.p-job-title + h3.p-name.company");
我可以提取所需的东西,但我需要的是一行中的h2内容+ h3内容,我的意思是“Android Developer NBC Corp.”。这样我得到了:
“Android Developer”
“NBC Corp。”
答案 0 :(得分:2)
一次拍摄文字after_update
和Android developer
?
试试这个:
NBC Corp.