我想从HTML代码中删除img。这个html代码是由soft生成的。 但我的img的src取决于html文档的名称。
例如,如果我的html代码的名称是test.html
src img将是
<img srx="test_one_way.gif">
如果名称为example.html
src img将是
<img srx="example_one_way.gif">
如你所见,只是src的一部分正在改变。
_one_way.gif
无法改变
所以我的问题是: 如何选择(删除)此img?
在我看来,我可以选择:"name"+_one_way.gif
我正在解析这样的文档:
Document doc=Jsoup.parse(new FileInputStream(readLine("file name: ")), "ISO-8859-1", "", Parser.xmlParser());
但我不知道如何做到这一点。
答案 0 :(得分:0)
最简单的方法是在jsoup中使用表达式选择img,如果你没有为它指定一个唯一的参数:
Elements elements = doc.select("img[src$=_one_way.gif");
Element firstElement = elements.first();
然后,您可以随时更改元素属性:
firstElement.attr("src", firstElement.attr("src").replaceFirst("^(.*?)(_one_way\\.gif)$", "$1") + "_one_way.gif");