JSOUP同时提取多个元素

时间:2015-05-14 12:25:41

标签: java android html parsing jsoup

我想知道是否有任何方法可以从这样的代码中提取:

<div class="container  ">
                      <h2 class="job">
                          <a href="/work/android-developer/madrid/11537332" rel="nofollow" 
                          title="job Android Developer" class="job-offer ">
                              Android Developer
                          </a>
                      </h2>
                          <h3 class="company">
                                  <a href="/emp/nbc/133192">
                                      NBC Corp. 
                              </a>
                         </h3>
              </div>

文字Android developerNBC Corp.一次拍摄?

doc.select("h2,h3.p-job-title,p-name-company a[href]");这样的东西不起作用。我也尝试了doc.select("h2.p-job-title a[href], h3.p-name company a[href]");

需要帮助!

编辑:我发现使用doc.select("h2.p-job-title + h3.p-name.company");我可以提取所需的东西,但我需要的是一行中的h2内容+ h3内容,我的意思是“Android Developer NBC Corp.”。这样我得到了:

“Android Developer”

“NBC Corp。”

1 个答案:

答案 0 :(得分:2)

一次拍摄文字after_updateAndroid developer

试试这个:

NBC Corp.