use mydb;
CREATE TABLE IF NOT EXISTS my_table(
processed_date date,
source varchar(100) ,
table_name varchar(1000) ,
comments varchar(1000) ,
column varchar(255)
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.orc.OrcSerde'
STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'
OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'
LOCATION 'hdfs://xxxxxx/xxxxxx/my_table ';
我有这样的表定义。我正在使用Spark程序在此表中插入一些记录。该表在很短的时间内有太多分区。对表的任何查询都很慢。 如何限制/减少创建的分区数。