Question

我不是Java的初学者，我在拼贴时学习Java。我目前正在做一个小程序，用于从在线网页获取数据。我做google reasearch，找到html解析器是一种简单的方法。

我的问题是如何设置类路径，并在TextPad中导入html解析器库？

------我的回答--------------------------------------- --------

我找到了解决这个问题的方法。我想我应该把它发布到这里，以防其他人和我有同样的问题。

我不知道解决这个问题是否合适。在这里。

我找到了一个链接 http://htmlparser.sourceforge.net/javadoc/doc-files/using.html

我下载了htmlparser zip文件，并将unziped lib文件夹下载到我的c盘。我在CMD中运行这一行。（我使用的是基于Windows的系统。）设置CLASSPATH = C：\ lib \ htmlparser.jar; C：\ lib \ htmllexer.jar;％CLASSPATH％那就行了。

我想这行是用于将新的.jar文件添加到旧的类路径中。％CLASSPATH％表示您的旧类路径。

Answer 1

我做了大量的屏幕抓取，发现Java太麻烦了。根据我的经验，使用Groovy来筛选数据。你不需要摆弄讨厌的类路径。因为groovy是Java的dsl，你知道Java它会很直接。您也可以使用Textpad作为编辑器。

例如：

def slurper = new XmlSlurper()
def htmlParser = slurper.parse("http://stackoverflow.com")

htmlParser.'**'.findAll{ it.@class == 'question-hyperlink'}.each {
   println it
}

以上代码来自博文：http://www.maclovin.de/2010/02/robust-html-parsing-the-groovy-way/

如何在Textpad中使用Html解析器？

1 个答案: