试图解析HTML字符串而不使用Jsoup。我还有其他选择吗?

时间:2015-04-24 05:28:14

标签: java parsing

我可以将所有HTML标记放入一个数组并循环解析它们吗?我尝试了很少的东西,但没有一个工作。帮助将不胜感激!! :) 例如:String str =(Head)                  (标题)                     你好,世界                  (/标题)               (/头);

我可以解析括号之间的所有内容。我的字符串中的(... sometext ...)? 这是我的学校项目,所以我不允许使用任何其他课程而不是基础课程

2 个答案:

答案 0 :(得分:0)

是的,你可以像@Jens在他的评论中所说,使用正则表达式

nvarchar(1000)

捕捉括号中的每个字符。

Running example

答案 1 :(得分:-2)

您可以使用htmlunit

HtmlUnit是“用于Java程序的GUI-Less浏览器”。它模拟HTML文档,并提供一个API,允许您调用页面,填写表单,单击链接等...就像在“普通”浏览器中一样。

http://htmlunit.sourceforge.net/gettingStarted.html