有人可以帮我从HTML页面获取元素吗?我不想使用库,我只想要一个或两个指针如何使用正确的正则表达式等。我有点坚持这一点,感谢所有的帮助。
答案 0 :(得分:1)
您必须首先决定是否在讨论HTML或XML。
如果您的文本是有效的XML文档,那么您可以使用JAXP来解析文档并以编程方式访问元素/属性(在正则表达式中不需要)。
如果您的文本不是有效的XML文档,那么在100%的情况下,没有任何设置正则表达式可以为您工作;您可以做的最好的事情是使用JDK的内置HTML解析器,作为Swing框架的一部分提供。
答案 1 :(得分:0)
JDK包括一个基本的HTML parser。它不是很强大,但你确实指定你“不想使用库”。所以......我想,把自己搞砸了?