如何使用Jsoup得到重复的数字?

时间:2015-12-06 13:10:00

标签: java jsoup

 <p class="tl f12">2015-12-06 18:19:42 由<span class="co4">咕咚</span>上传
  <span style="display:none;  margin-top: 5px" class="fr marr15 mc_tips" id="mc_tips_dd5e7f6e-9c02-11e5-a3c1-015176cddf29"><img src="http://static.codoon.com/image/mc/18.gif"></span></p>
            <table cellpadding="0" cellspacing="0" class="f12 co6" route_id="dd5e7f6e-9c02-11e5-a3c1-015176cddf29"  id="dd5e7f6e-9c02-11e5-a3c1-015176cddf29" >
                <tr>
                    <td width="70" height="42" class="tc">
                        <div class="m_tc" style="width:32px; height:32px;">
                            <img src="http://static.codoon.com/image/app_icon/walk.png" />
                        </div>
                    </td>
                    <td width="100" height="42">
                        <span>距离</span><br /><span class="f18 co14 fb f24">0.22</span><span class="f12">公里</span>
                    </td>
                    <td width="100" height="42">
                        <span>运动时长</span><br /><span class="f18 co14 fb f24">00:03</span>   
                    </td>
                    <td width="120" height="42">
                        <span>平均速度</span><br /><span class="f18 co14 fb f24">3.5</span><span class="f12">公里/小时</span>
                    </td>
                    <td  width="110">                       
                        <span>燃烧</span><br /><span class="f18 co14 fb f24">14.9</span>大卡
                    </td>
                    <td  class="tl" >

                    </td>
                </tr>
            </table>

我得到了这样的数据,我希望在课堂上获得数据=&#34; f18 co14 fb f24&#34; 所以我用Jsoup作为

Elements elements = document.select(".f18").select(".co14").select(".fb").select(".f24");
然后我得到了它们。但是当有一些重复的数字时,例如

<p class="tl f12">2015-12-06 18:19:42 由<span class="co4">咕咚</span>上传<span style="display:none;  margin-top: 5px" class="fr marr15 mc_tips" id="mc_tips_dd5e7f6e-9c02-11e5-a3c1-015176cddf29"><img src="http://static.codoon.com/image/mc/18.gif"></span></p>
        <table cellpadding="0" cellspacing="0" class="f12 co6" route_id="dd5e7f6e-9c02-11e5-a3c1-015176cddf29"  id="dd5e7f6e-9c02-11e5-a3c1-015176cddf29" >
            <tr>
                <td width="70" height="42" class="tc">
                    <div class="m_tc" style="width:32px; height:32px;">
                        <img src="http://static.codoon.com/image/app_icon/walk.png" />
                    </div>
                </td>
                <td width="100" height="42">
                    <span>距离</span><br /><span class="f18 co14 fb f24">0.22</span><span class="f12">公里</span>
                </td>
                <td width="100" height="42">
                    <span>运动时长</span><br /><span class="f18 co14 fb f24">00:03</span>   
                </td>
                <td width="120" height="42">
                    <span>平均速度</span><br /><span class="f18 co14 fb f24">3.5</span><span class="f12">公里/小时</span>
                </td>
                <td  width="110">                       
                    <span>燃烧</span><br /><span class="f18 co14 fb f24">14.9</span>大卡
                </td>
                <td  class="tl" >

                </td>
            </tr>
        </table>            
        <p class="tl f12">2015-12-06 17:56:32 由<span class="co4">咕咚</span>上传<span style="display:none;  margin-top: 5px" class="fr marr15 mc_tips" id="mc_tips_a1244433-9bff-11e5-927a-015176b8ab4a"><img src="http://static.codoon.com/image/mc/18.gif"></span></p>
        <table cellpadding="0" cellspacing="0" class="f12 co6" route_id="a1244433-9bff-11e5-927a-015176b8ab4a"  id="a1244433-9bff-11e5-927a-015176b8ab4a" >
            <tr>
                <td width="70" height="42" class="tc">
                    <div class="m_tc" style="width:32px; height:32px;">
                        <img src="http://static.codoon.com/image/app_icon/walk.png" />
                    </div>
                </td>
                <td width="100" height="42">
                    <span>距离</span><br /><span class="f18 co14 fb f24">0.22</span><span class="f12">公里</span>
                </td>
                <td width="100" height="42">
                    <span>运动时长</span><br /><span class="f18 co14 fb f24">00:06</span>   
                </td>
                <td width="120" height="42">
                    <span>平均速度</span><br /><span class="f18 co14 fb f24">2.0</span><span class="f12">公里/小时</span>
                </td>
                <td  width="110">                       
                    <span>燃烧</span><br /><span class="f18 co14 fb f24">13.6</span>大卡
                </td>
                <td  class="tl" >

                </td>
            </tr>
        </table>
它不会像我这样回归  0.22 00:03 3.5 14.9 0.22 00:01 3.3 6.0 它返回0.22 00:03 3.5 14.9 00:01 3.3 6.0 比如删除重复的数字。我怎样才能获得所有的数字?

这是我的演示 enter link description here

2 个答案:

答案 0 :(得分:0)

我猜这是一个错误。我在JSoup存储库here上创建了一个问题。

获得所有预期元素的一种方法是不对返回的元素重复select方法调用,但将它们全部合并为一个select:

Elements els = document.select(".f18.co14.fb.f24");

这也包含重复项。

答案 1 :(得分:0)

它可能是jsoup版本1.8.2+中的错误,切换到版本1.8.1并且您将获得您期望的输出。