我是Hadoop的新手。我尝试编写一个程序来获取每年的最小值和最大值。数据集如下:
Product code,Station number,Year,Month,Monthly Precipitation Total (millimetres),Quality
IDCJAC0001,023093,1978,01,4.6,Y
IDCJAC0001,023093,1978,02,11.4,Y
IDCJAC0001,023093,1978,03,4.8,Y
IDCJAC0001,023093,1978,04,46.2,Y
IDCJAC0001,023093,1978,05,52.7,Y
我正在使用mac并在学校集群上进行Hadoop。 这是我的命令行:
hadoop jar hw1-1.0-SNAPSHOT.jar /samplefolder/IDCJAC0001Data1.csv /OUTPUT
但是结果显示错误:线程“ main”中的异常java.lang.ClassNotFoundException:/ samplefolder / IDCJAC0001Data1 / csv
我已经在网站上搜索并尝试了不同的命令,例如hadoop jar hw1-1.0-SNAPSHOT.jar org.mycompany.hw1.SolarMinMax /samplefolder/IDCJAC0001Data1.csv /OUTPUT
,但是结果是相同的...
请帮助我解决这个问题
答案 0 :(得分:1)
您需要使用
hadoop jar hw1-1.0-SNAPSHOT.jar org.mycompany.hw1.SolarMinMax /samplefolder/IDCJAC0001Data1.csv /OUTPUT
然后将代码更改为
FileInputFormat.addInputPath(job, new Path(args[1]));
FileOutputFormat.setOutputPath(job, new Path(args[2]));
因为args[0]
是类名。