Question

我正在尝试使用Java中的spark读取json文件。我尝试的一些变化是：

SparkConf conf = new SparkConf（）。setAppName（“Search”）。setMaster（“local [*]”）;

DataFrame df = sqlContext.read（）。json（“../ Users / pshah / Desktop / sample.json / *”）;

代码：

import java.util.Arrays;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.FlatMapFunction;
import org.apache.spark.api.java.function.Function;
import org.apache.spark.api.java.function.PairFunction;
import org.apache.spark.sql.DataFrame;
import org.apache.spark.sql.SQLContext;
public class ParseData {

public static void main(String args[]){
    SparkConf conf = new SparkConf().setAppName("Search").setMaster("local");
    JavaSparkContext sc= new JavaSparkContext(conf);
    SQLContext sqlContext = new org.apache.spark.sql.SQLContext(sc);
    // Create the DataFrame
    DataFrame df = sqlContext.read().json("/Users/pshah/Desktop/sample.json");
    // Show the content of the DataFrame
    df.show();
}}

错误：

Exception in thread "main" java.io.IOException: No input paths specified in job
at org.apache.hadoop.mapred.FileInputFormat.listStatus(FileInputFormat.java:198)

Answer 1

我写了相同的代码，并遇到了同样的问题。我把people.json文件放在项目目录src / main / resources下。原因是程序无法找到该文件。将people.json文件复制到程序的工作目录后，该程序运行良好

线程“main”中的异常java.io.IOException：在job中没有指定输入路径

1 个答案: