使用Java从标记中提取URL

时间:2014-02-07 04:42:29

标签: java jsoup

我对Java很陌生,我不知道如何在不使用HTML Parser的情况下从Java中提取部件。

让我们假设我有以下标记:

<img width="506" height="200" src="Jozo/image014.png" v:shapes="image_x0020_1" />

我想使用正则表达式提取Jozo / image014.png,但如果有人能帮我解决这个问题会很棒......

非常感谢

1 个答案:

答案 0 :(得分:2)

使用html解析器Regex不准确解析html内容

String htmltag = "<img width=\"506\" height=\"200\" src=\"Jozo/image014.png\" "
        + "v:shapes=\"image_x0020_1\" />";
Document doc = Jsoup.parse(htmltag);

Elements ImageUrl = doc.select("img");
for (Element el : ImageUrl)
    System.out.println(el.attr("src"));