Hadoop / Eclipse - 线程中的异常" main" java.lang.NoClassDefFoundError:org / apache / hadoop / fs / FileSystem

时间:2015-04-10 00:07:13

标签: java eclipse hadoop hdfs

我正在尝试从Manning Publishing的Chuck Lam运行Hadoop in Action中的PutMerge程序。它应该很简单,但是我尝试运行它时遇到了一些问题,而且我已经遇到了这个我无法弄清楚的错误。与此同时,我正在运行一个基本的wordcount程序没有问题。我现在花了大约3天时间。我已经完成了所有可能的研究,而我只是迷失了。

你会有任何想法吗?

程序:

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;


public class PutMerge {

    public static void main(String[] args) throws IOException {
        Configuration conf = new Configuration();

        FileSystem hdfs = FileSystem.get(conf);
        FileSystem local = FileSystem.getLocal(conf);

        Path inputDir = new Path(args[0]);
        Path hdfsFile = new Path(args[1]);


        try{
            FileStatus[] inputFiles = local.listStatus(inputDir);
            FSDataOutputStream out = hdfs.create(hdfsFile);

            for (int i=0; i<=inputFiles.length; i++){
                System.out.println(inputFiles[i].getPath().getName());
                FSDataInputStream in = local.open(inputFiles[i].getPath());

                byte buffer[] = new byte[256];
                int bytesRead = 0;

                while( (bytesRead = in.read(buffer)) > 0) {
                    out.write(buffer, 0, bytesRead);
                }

                in.close();

            }

            out.close();

        } catch(IOException e){

            e.printStackTrace();

        }

    }

}

Eclipse的输出错误:

    2015-04-09 19:45:48,321 WARN  util.NativeCodeLoader (NativeCodeLoader.java:<clinit>(62)) - Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/fs/FileSystem
    at java.lang.ClassLoader.findBootstrapClass(Native Method)
    at java.lang.ClassLoader.findBootstrapClassOrNull(ClassLoader.java:1012)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:413)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:411)
    at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:308)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
    at java.lang.Class.forName0(Native Method)
    at java.lang.Class.forName(Class.java:344)
    at java.util.ServiceLoader$LazyIterator.nextService(ServiceLoader.java:370)
    at java.util.ServiceLoader$LazyIterator.next(ServiceLoader.java:404)
    at java.util.ServiceLoader$1.next(ServiceLoader.java:480)
    at org.apache.hadoop.fs.FileSystem.loadFileSystems(FileSystem.java:2563)
    at org.apache.hadoop.fs.FileSystem.getFileSystemClass(FileSystem.java:2574)
    at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:2591)
    at org.apache.hadoop.fs.FileSystem.access$200(FileSystem.java:91)
    at org.apache.hadoop.fs.FileSystem$Cache.getInternal(FileSystem.java:2630)
    at org.apache.hadoop.fs.FileSystem$Cache.get(FileSystem.java:2612)
    at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:370)
    at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:169)
    at PutMerge.main(PutMerge.java:16)

关于Eclipse:

Eclipse IDE for Java Developers
Version: Luna Service Release 2 (4.4.2)
Build id: 20150219-0600

Eclipse Installation Details

关于Hadooop:

Hadoop 2.6.0
Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r e3496499ecb8d220fba99dc5ed4c99c8f9e33bb1
Compiled by jenkins on 2014-11-13T21:10Z
Compiled with protoc 2.5.0
From source with checksum 18e43357c8f927c0695f1e9522859d6a
This command was run using /usr/local/hadoop-2.6.0/share/hadoop/common/hadoop-common-2.6.0.jar

关于Java:

java version "1.8.0_31"
Java(TM) SE Runtime Environment (build 1.8.0_31-b13)
Java HotSpot(TM) 64-Bit Server VM (build 25.31-b07, mixed mode)  

关于我的机器:

Mac OSX 10.9.5

Java构建路径 - 库中的外部JAR:

Hadoop Common

4 个答案:

答案 0 :(得分:1)

我对Eclipse IDE的经验: From Package Explorer

我安装ubuntu的基本路径是usr / hadoop / hadoop-2.7.1(让我们说CONF) 我添加了两个jar文件,分别来自CONF / share / hadoop / common / lib和CONF / share / hadoop / common。 这是java代码(来自Hadoop in Action):

import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;


public class PutMerge {


public static void main(String[] args) throws IOException {
        Configuration conf = new Configuration();

        conf.set("fs.file.impl",org.apache.hadoop.fs.LocalFileSystem.class.getName());

        org.apache.hadoop.fs.FileSystem hdfs = org.apache.hadoop.fs.FileSystem.get(conf);
        FileSystem local = org.apache.hadoop.fs.FileSystem.getLocal(conf);
        Path inputDir = new Path(args[0]);
        Path hdfsFile = new Path(args[1]);
        try {
            FileStatus[] inputFiles = local.listStatus(inputDir);
            FSDataOutputStream out = hdfs.create(hdfsFile);
            for (int i=0; i<inputFiles.length; i++) {
                System.out.println(inputFiles[i].getPath().getName());
                FSDataInputStream in = local.open(inputFiles[i].getPath());
                byte buffer[] = new byte[256];
                int bytesRead = 0;
                while( (bytesRead = in.read(buffer)) > 0) {
                    out.write(buffer, 0, bytesRead);
                }
                in.close();
            }
            out.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

对我来说,解决方案是从此代码中导出.jar文件,这就是我所做的: 右键单击PutMerge项目,然后导出(从弹出菜单):

Always from Package Explorer

并将jar文件保存在主目录/ hduser目录下名为PutMerge的文件夹中 From filesystem, PutMerge.jar

在另一个名为input的文件夹(路径/ home / hduser / input)中,有三个.txt文件作为PutMerge过程的输入: Three input files

现在我们准备从终端会话启动命令: hadoop jar /home/hduser/PutMerge/PutMerge.jar PutMerge / home / hduser / input output4 / all

和命令/usr/hadoop/hadoop-2.7.1$ hdfs dfs -cat / output4 / all

将包含三个单个文件的所有文本。

答案 1 :(得分:0)

在你的代码中加上这样的

配置配置=新配置();             configuration.set( “fs.hdfs.impl”,org.apache.hadoop.hdfs.DistributedFileSystem.class.getName());             configuration.set( “fs.file.impl”,org.apache.hadoop.fs.LocalFileSystem.class.getName());

答案 2 :(得分:0)

当我的maven存储库包含损坏的JAR文件时,我遇到了这个问题。和我一样,在查看Java项目的“Maven Dependencies”时,我可以看到eclipse中存在hadoop-common-x.x.x.jar。但是,当在eclipse中扩展JAR文件并选择名为org.apache.hadoop.fs.FSDataInputStream的类时,eclipse报告的消息类似于“无效的LOC头”。

从我的本地maven存储库中删除所有文件并再次执行mvn install解决了我的问题

答案 3 :(得分:0)

如果您正在使用配置来运行应用程序进行调试。如果您有任何依赖项,并且已经提到要提供的范围,请确保已选中包含具有提供的范围的依赖项的复选框。 遵循这种方法对我有用