Hive Context加载到表中

时间:2016-08-31 05:18:49

标签: apache-spark hive hiveql hadoop2

我正在选择一个整个表并加载到一个新表中。它已正确加载但值不会覆盖。 Spark 1.6版 以下是代码段

DataFrame df = hiveContext.createDataFrame(JavaRDD<Row>, StructType);
df.registerTempTable("tempregtable"); 
String query="insert into employee select * from tempregtable";
hiveContext.sql(query);

我正在删除并创建表(employee)并执行上面的代码。但旧的行值仍会附加新行。例如,如果我插入了四行并删除了表并再次插入四行8行已添加。请帮助我,如何覆盖数据而不是追加。

此致 普拉卡什

1 个答案:

答案 0 :(得分:3)

String query="insert overwrite table employee select * from tempregtable";

INSERT OVERWRITE将覆盖表格或分区中的所有现有数据

INSERT INTO将附加到表格或分区

参考:Hive Language Manual