jsoup提取标记中元素的值

时间:2018-08-06 09:37:29

标签: java web-scraping jsoup

我是Jsoup的新手。我正在尝试为变量“ y”提取一系列值。 我有这样的html:

<text class="price label" font-family="Dosis" font-size="12px" font-weight="800" fill="white" text-anchor="middle" x="49" y="408.0421247847397">5,24</text>

<text class="price label" font-family="Dosis" font-size="12px" font-weight="800" fill="white" text-anchor="middle" x="122" y="412.832428136177">5,11</text>

我想提取y的值,即408.0421247847397、412.832428136177和该属性之后和标记之前的值,即5.24、5、11。

您能给我推荐一个方法吗?

我只能提取y(408.0421247847397)的第一个值。但不是第二个值(412.832428136177)。我也无法提取标题5.24和5.11。我已经完成了:

doc1 =Jsoup.parse(input,"UTF-8", "");
Elements values = doc1.select("g");
Elements xyz = doc1.select("text.price.label");
String abc = xyz.attr("y");

1 个答案:

答案 0 :(得分:1)

import tkinter as tk # <-- avoid star imports def f(): print(number.get()) fenster = tk.Tk() fenster.title ("Sensors") number = tk.IntVar() button = tk.Checkbutton(fenster, text="Check me", variable=number, command=f) button.pack() fenster.mainloop() # call mainloop on your root window 的结果是select的{​​{1}}(多个)类。此类允许我们使用一些为单个Elements设计的方法,使我们可以从一个(第一个)选定元素中访问值。仅选择一个元素时,这将很有帮助。

但是,如果使用的查询找到了更多您要访问的extends ArrayList<Element>,则需要遍历查询结果(此处为Element)。为此,您可以使用类似

的循环
Element