这是我第一次尝试使用Jsoup。 我无法理解“选择”操作。
Elements media = doc.select("[src]");
这意味着在页面中作为输入搜索src并选择该行。 所以,我可以使用src.tagname,src.width和所有...
来读取该文本以下是什么意思?
Elements links = doc.select("a[href]");
Elements imports = doc.select("link[href]");
我有点困惑你能解释一下[href]是什么意思以及如何使用它
答案 0 :(得分:1)
Elements links = doc.select("a[href]");
- >选择具有属性a
href
- 标记
示例: <a href="something">...</a>
但正如BalusC之前所说:看看documentation about selector syntax
“区域问题”:
doc.select("area[title]")
选择与此匹配的所有元素,而不是属性!
如果您需要所有名称(=属性title
),您可以使用:
Document doc = Jsoup.connect("http://en.wikipedia.org/wiki/States_and_territories_of_India").get();
Elements elements = doc.select("area[title]");
for( Element element : elements )
{
String title = element.attr("title");
// Do something with the title
System.out.println(title);
}