如何结合.java和html?

时间:2012-12-10 21:00:11

标签: java html eclipse web-crawler

我正在尝试创建一个Web应用程序,用户可以从下拉列表中选择一个电影的名称(例如“Skyfall”)。然后我想执行一个爬虫去rottentomatoes.com并获取与这部电影有关的所有html页面。我使用Tomcat在Eclipse中创建了我的Web应用程序(GUI)。我有一个网络爬虫:crawler4j,如果我选择将主.java文件作为应用程序运行,它就会运行。我怎样才能将这两者结合起来?

  1. 我希望我可以简单地用java调用java类文件 我的html中的参数(电影的名称),但就是这样 可能?
  2. 我是否必须使用抓取工具创建单独的Applet 为了在我的HTML中执行它?我可以这样做并发送字符串 用它(从html下拉列表中选择电影的名称 列表,所以我需要通过搜索器搜索发送?)

2 个答案:

答案 0 :(得分:1)

我通过实现一个激活爬虫的Servlet来解决这个问题,正如Marvo在评论中所建议的那样。

答案 1 :(得分:0)

您可以使用Beautiful Soup,我会一直使用它来获取其他网站的内容
或者,您也可以使用HtmlUnit