应用错误收集

use mydb;
CREATE TABLE IF NOT EXISTS my_table(
processed_date date,
source varchar(100) ,
table_name varchar(1000) ,
comments varchar(1000) ,
column varchar(255) 
)     
ROW FORMAT SERDE   'org.apache.hadoop.hive.ql.io.orc.OrcSerde' 
STORED AS INPUTFORMAT   'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat' 
OUTPUTFORMAT   'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'
LOCATION  'hdfs://xxxxxx/xxxxxx/my_table ';

我有这样的表定义。我正在使用Spark程序在此表中插入一些记录。该表在很短的时间内有太多分区。对表的任何查询都很慢。如何限制/减少创建的分区数。

Hive表分区太多了

0 个答案: