我有一个简单的浏览器" hello world" applet被召唤:
import java.awt.Graphics;
public class CrawlCrowd extends java.applet.Applet
{
public void init()
{
resize(150,25);
}
public void paint(Graphics g) {
g.drawString("Hello world!", 50, 25);
}
}
我想要包含Nutch,以便我可以在applet中动态抓取网址。如何包含它并执行简单的爬行?
答案 0 :(得分:0)
编写一个在您的服务器上运行的Web服务。使用url列表从客户端调用webservice。在服务器端的种子文件中写下url。
在Web服务中使用Apache commons-cli来运行启动nutch的脚本文件:
Executor exec = new DefaultExecutor();
exec.setWorkingDirectory(file);
CommandLine cl = new CommandLine("./runCommand.sh");
int exitvalue = exec.execute(cl);
if (exitvalue == 0)
System.out.println("./runCommand.sh succeeded....");