无法将数据框保存为Hive表,抛出文件未找到异常

时间:2017-07-25 13:51:00

标签: apache-spark hive pyspark pyspark-sql

当我尝试将数据框保存为pyspark中的Hive表时

df_writer.saveAsTable('hive_table', format='parquet', mode='overwrite')

我收到以下错误:

  

引起:org.apache.hadoop.mapred.InvalidInputException:输入路径   不存在:   hdfs:// hostname:8020 / apps / hive / warehouse / testdb.db / hive_table at   org.apache.hadoop.mapred.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:287)     在   org.apache.hadoop.mapred.FileInputFormat.listStatus(FileInputFormat.java:229)

我有路径直到' hdfs:// hostname:8020 / apps / hive / warehouse / testdb.db /'

请提供您的意见

1 个答案:

答案 0 :(得分:0)

尝试将DataFrameWriter用作

df.write.mode(SaveMode.Append).insertInto(s"${dbName}.${t.table}")