我正在解析json文件中的数据。现在,我有一个像这样的数据
String Content = <p><img class="alignleft size-full wp-image-56999" alt="abdullah" src="http://www.some.com/wp-content/uploads/2013/12/imageName.jpg" width="348" height="239" />Text</p>
<p>Text</p> <p>Text</p><p>The post <a href="Some URL">Some Text</a> appeared first on <a href="http://www.some.com">Some Webiste</a></p>
现在,我想把这个字符串分成两部分。我想从src
获取此网址。
http://www.some.com/wp-content/uploads/2013/12/imageName.jpg
并将其存储为变量。另外,我想删除最后一行The Post appeared...
并将文本存储在另一个变量中。
所以,问题是:
答案 0 :(得分:3)
IN Java
获取文档对象
Document originalDoc = new SAXReader().read(new StringReader("<div>data</div>");
然后你可以解析它..(阅读本教程)
http://www.mkyong.com/java/how-to-read-xml-file-in-java-dom-parser/
在JavaScript中 获取属性
var url = document.getElementsByTagName('img')[0].getAttribute('src');
如果您有一个字符串并且想要一个文档对象,请使用jquery
string stringValue = '<div>data</div>';
var myObject= $(stringValue);
答案 1 :(得分:2)
String.substring(firstIndex, lastIndex)
从src
属性JSoup
这样的HTML解析器,在不久的将来会很有用答案 2 :(得分:0)
如果它是一个结构良好的字符串,你可以使用任何DOM解析器解析它并从中提取数据......