Question

我试图从给定的字符串中获取HTML图像标记网址。应该有一些正则表达式来获得它。但不知道该怎么做。任何人都可以帮助我。

e.g。

I have string like this with <br> some HTML<b>tag</b>
with <img src="http://xyz.com/par.jpg" align="left"/> image tags in it.
how can get it ?

我只想从字符串中 http://xyz.com/par.jpg

Answer 1

请参阅this问题以供参考。基本上它说使用：

String imgRegex = "<img[^>]+src\\s*=\\s*['\"]([^'\"]+)['\"][^>]*>";

Answer 2

我使用jsoup。它非常易于使用且重量轻。有些版本不兼容Java 1.5，但似乎他们解决了这个问题。

String html = str;
Document doc = Jsoup.parse(html);
Elements pngs = doc.select("img[src$=.png]"); // img with src ending .png

Answer 3

全部进口jsoap：

compile group: 'org.jsoup', name: 'jsoup', version: '1.7.2'

然后你可以使用这个：

private ArrayList pullLinks(String html) {
    ArrayList links = new ArrayList();
    Elements srcs = Jsoup.parse(html).select("[src]"); //get All tags containing "src"
    for (int i = 0; i < srcs.size(); i++) {
        links.add(srcs.get(i).attr("abs:src")); // get links of selected tags
    }
    return links;
}

Answer 4

XMLPullParser可以很容易地做到这一点。虽然，如果它是一个简单的小字符串，它可能是矫枉过正。

     XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
     XmlPullParser xpp = factory.newPullParser();

     xpp.setInput( new StringReader ( "<html>I have string like this with <br> some HTML<b>tag</b> with <img src=\"http://xyz.com/par.jpg\" align=\"left\"/> image tags in it. how can get it ?</html>" ) );
     int eventType = xpp.getEventType();
     while (eventType != XmlPullParser.END_DOCUMENT) {
      if(eventType == XmlPullParser.START_TAG && "img".equals(xpp.getName()) {
          //found an image start tag, extract the attribute 'src' from here...
      }
      eventType = xpp.next();
     }

android java从字符串中获取html图像标记

4 个答案: