Question

我正在解析json文件中的数据。现在，我有一个像这样的数据

String Content = <p><img class="alignleft size-full wp-image-56999" alt="abdullah" src="http://www.some.com/wp-content/uploads/2013/12/imageName.jpg" width="348" height="239" />Text</p>
<p>Text</p> <p>Text</p><p>The post <a href="Some URL">Some Text</a> appeared first on <a href="http://www.some.com">Some Webiste</a></p>

现在，我想把这个字符串分成两部分。我想从src获取此网址。

http://www.some.com/wp-content/uploads/2013/12/imageName.jpg

并将其存储为变量。另外，我想删除最后一行The Post appeared...并将文本存储在另一个变量中。

所以，问题是：

有可能得到那个吗？
如果可能，我该如何实现？

Answer 1

IN Java

获取文档对象

Document originalDoc = new SAXReader().read(new StringReader("<div>data</div>");

然后你可以解析它..（阅读本教程）

http://www.mkyong.com/java/how-to-read-xml-file-in-java-dom-parser/

在JavaScript中 获取属性

var url = document.getElementsByTagName('img')[0].getAttribute('src');

如果您有一个字符串并且想要一个文档对象，请使用jquery

string stringValue = '<div>data</div>';
var myObject= $(stringValue);

Answer 2

使用String.substring(firstIndex, lastIndex)从src属性
学会使用像JSoup这样的HTML解析器，在不久的将来会很有用

Answer 3

如果它是一个结构良好的字符串，你可以使用任何DOM解析器解析它并从中提取数据......

从java中的字符串中获取<img/>值

3 个答案: