在Java中使用jsoup在所有div类名称和span类名称相同时如何查找内部元素

时间:2018-09-08 09:23:32

标签: java jsoup

<div class="xyOfqd">
   <div class="hAyfc">
     <div class="BgcNfc">Updated</div>
       <span class="htlgb">
          <div>
             <span class="htlgb">July 14, 2018</span>
          </div>
       </span>
     </div>
   <div class="hAyfc">
     <div class="BgcNfc">Size</div>
     <span class="htlgb">
        <div><span class="htlgb">3.9M</span></div>
     </span>
  </div>
</div>

我希望在Java中使用jsoup从html上方获取所有文本。

赞这个 更新 七月14,2018 尺寸 390万

已更新且大小不变,但日期和3.9M是动态值。

基本上,我正在尝试从Google Play商店中提取值。

1 个答案:

答案 0 :(得分:2)

您在这里有两个问题:

  1. 查找具有相同名称的元素的CSS选择器。这是比较容易的部分,因为它们都有不同的选择器。如果使用浏览器的开发人员工具,您将看到update的选择器是div.hAyfc:nth-child(1) > div:nth-child(1),而size的选择者是div.hAyfc:nth-child(2) > div:nth-child(1)
  2. 获取动态值-好的,Jsoup无法获取动态值。您可以尝试找到获取这些值的ajax调用,并尝试对Jsoup进行操作,也可以使用其他工具,例如PhantomJS