将Jsoup Jar添加到MapReduce

时间:2016-12-20 16:02:29

标签: java hadoop mapreduce

我正在使用Jsoup.jar使用MapReduce从多个网站的元标记中获取关键字。网站列表保存在txt文件中。但是当我在终端中编译java文件时,它表示包 org.jsoup.Jsoup不存在。我确保jar与java文件位于同一文件夹中。

错误屏幕截图:

enter image description here

1 个答案:

答案 0 :(得分:0)

您必须将jar文件放在Distributed Cache中,这是共享第三方库的最佳实践,

请查看以下链接以获取进一步的帮助,

http://blog.cloudera.com/blog/2011/01/how-to-include-third-party-libraries-in-your-map-reduce-job/

https://hadoopi.wordpress.com/2014/06/05/hadoop-add-third-party-libraries-to-mapreduce-job/