Question

我正在开发一个包含Web爬虫解析器的Java程序。我使用Jsoup从网页下载HTML源代码，我想提取src＆＃39; s和alt＆＃39; s以便将它们写入CSV文件。问题是，我无法找到删除alt=""和src=""的方法。我不想在CSV文件中使用它们，我只想要图片网址及其说明。有没有人有想法？这是我的工作：

Document html = Jsoup.connect(url).get();
Elements titres = html.select("img[src$=.jpg], div[class$=price] ");

Answer 1

感谢您的回答，但由于这是一个专业项目，我已经找到了另一种方法。对于那些想知道我是怎么做的人

String image = titres.get(i).attr("src");

如何提取HTML属性的内容

1 个答案: