我正在使用Jsoup.jar使用MapReduce从多个网站的元标记中获取关键字。网站列表保存在txt文件中。但是当我在终端中编译java文件时,它表示包 org.jsoup.Jsoup不存在。我确保jar与java文件位于同一文件夹中。
错误屏幕截图:
答案 0 :(得分:0)
您必须将jar文件放在Distributed Cache中,这是共享第三方库的最佳实践,
请查看以下链接以获取进一步的帮助,
http://blog.cloudera.com/blog/2011/01/how-to-include-third-party-libraries-in-your-map-reduce-job/
https://hadoopi.wordpress.com/2014/06/05/hadoop-add-third-party-libraries-to-mapreduce-job/