从java中的字符串中获取<img/>值

时间:2013-12-02 07:57:26

标签: java regex string

我正在解析json文件中的数据。现在,我有一个像这样的数据

String Content = <p><img class="alignleft size-full wp-image-56999" alt="abdullah" src="http://www.some.com/wp-content/uploads/2013/12/imageName.jpg" width="348" height="239" />Text</p>
<p>Text</p> <p>Text</p><p>The post <a href="Some URL">Some Text</a> appeared first on <a href="http://www.some.com">Some Webiste</a></p>

现在,我想把这个字符串分成两部分。我想从src获取此网址。

http://www.some.com/wp-content/uploads/2013/12/imageName.jpg

并将其存储为变量。另外,我想删除最后一行The Post appeared...并将文本存储在另一个变量中。

所以,问题是:

  1. 有可能得到那个吗?
  2. 如果可能,我该如何实现?

3 个答案:

答案 0 :(得分:3)

IN Java

获取文档对象

Document originalDoc = new SAXReader().read(new StringReader("<div>data</div>");

然后你可以解析它..(阅读本教程)

http://www.mkyong.com/java/how-to-read-xml-file-in-java-dom-parser/

在JavaScript中  获取属性

var url = document.getElementsByTagName('img')[0].getAttribute('src');

如果您有一个字符串并且想要一个文档对象,请使用jquery

string stringValue = '<div>data</div>';
var myObject= $(stringValue); 

答案 1 :(得分:2)

  1. 使用String.substring(firstIndex, lastIndex)src属性
  2. 获取链接
  3. 学会使用像JSoup这样的HTML解析器,在不久的将来会很有用

答案 2 :(得分:0)

如果它是一个结构良好的字符串,你可以使用任何DOM解析器解析它并从中提取数据......