我正在选择一个整个表并加载到一个新表中。它已正确加载但值不会覆盖。 Spark 1.6版 以下是代码段
DataFrame df = hiveContext.createDataFrame(JavaRDD<Row>, StructType);
df.registerTempTable("tempregtable");
String query="insert into employee select * from tempregtable";
hiveContext.sql(query);
我正在删除并创建表(employee)并执行上面的代码。但旧的行值仍会附加新行。例如,如果我插入了四行并删除了表并再次插入四行8行已添加。请帮助我,如何覆盖数据而不是追加。
此致 普拉卡什
答案 0 :(得分:3)
试
String query="insert overwrite table employee select * from tempregtable";
INSERT OVERWRITE
将覆盖表格或分区中的所有现有数据
INSERT INTO
将附加到表格或分区