如何在简单的Java应用程序中包含Nutch?

时间:2014-11-06 18:03:34

标签: java nutch

我有一个简单的浏览器" hello world" applet被召唤:

import java.awt.Graphics;

public class CrawlCrowd extends java.applet.Applet 
{
    public void init() 
    {
        resize(150,25);
    }

    public void paint(Graphics g) {
        g.drawString("Hello world!", 50, 25);
    }

}

我想要包含Nutch,以便我可以在applet中动态抓取网址。如何包含它并执行简单的爬行?

1 个答案:

答案 0 :(得分:0)

编写一个在您的服务器上运行的Web服务。使用url列表从客户端调用webservice。在服务器端的种子文件中写下url。

在Web服务中使用Apache commons-cli来运行启动nutch的脚本文件:

Executor exec = new DefaultExecutor();
exec.setWorkingDirectory(file);
CommandLine cl = new CommandLine("./runCommand.sh");

int exitvalue = exec.execute(cl);
if (exitvalue == 0)
    System.out.println("./runCommand.sh succeeded....");