我不是Java的初学者,我在拼贴时学习Java。我目前正在做一个小程序,用于从在线网页获取数据。我做google reasearch,找到html解析器是一种简单的方法。
我的问题是如何设置类路径,并在TextPad中导入html解析器库?
------我的回答--------------------------------------- --------
我找到了解决这个问题的方法。我想我应该把它发布到这里,以防其他人和我有同样的问题。
我不知道解决这个问题是否合适。在这里。
我找到了一个链接 http://htmlparser.sourceforge.net/javadoc/doc-files/using.html
我下载了htmlparser zip文件,并将unziped lib文件夹下载到我的c盘。 我在CMD中运行这一行。(我使用的是基于Windows的系统。) 设置CLASSPATH = C:\ lib \ htmlparser.jar; C:\ lib \ htmllexer.jar;%CLASSPATH% 那就行了。
我想这行是用于将新的.jar文件添加到旧的类路径中。 %CLASSPATH%表示您的旧类路径。
答案 0 :(得分:0)
我做了大量的屏幕抓取,发现Java太麻烦了。根据我的经验,使用Groovy来筛选数据。你不需要摆弄讨厌的类路径。因为groovy是Java的dsl,你知道Java它会很直接。您也可以使用Textpad作为编辑器。
例如:
def slurper = new XmlSlurper()
def htmlParser = slurper.parse("http://stackoverflow.com")
htmlParser.'**'.findAll{ it.@class == 'question-hyperlink'}.each {
println it
}
以上代码来自博文:http://www.maclovin.de/2010/02/robust-html-parsing-the-groovy-way/