使用jsoup删除src的一部分正在更改的img

时间:2014-04-08 15:23:12

标签: java image jsoup

我想从HTML代码中删除img。这个html代码是由soft生成的。 但我的img的src取决于html文档的名称。

例如,如果我的html代码的名称是test.html src img将是

<img srx="test_one_way.gif">

如果名称为example.html

src img将是

<img srx="example_one_way.gif">

如你所见,只是src的一部分正在改变。

_one_way.gif无法改变

所以我的问题是: 如何选择(删除)此img?

在我看来,我可以选择:"name"+_one_way.gif

我正在解析这样的文档:

Document doc=Jsoup.parse(new FileInputStream(readLine("file name: ")), "ISO-8859-1", "", Parser.xmlParser());

但我不知道如何做到这一点。

1 个答案:

答案 0 :(得分:0)

最简单的方法是在jsoup中使用表达式选择img,如果你没有为它指定一个唯一的参数:

Elements elements = doc.select("img[src$=_one_way.gif");
Element firstElement = elements.first();

然后,您可以随时更改元素属性:

firstElement.attr("src", firstElement.attr("src").replaceFirst("^(.*?)(_one_way\\.gif)$", "$1") + "_one_way.gif");