msck修复表不能在未分区表上工作-配置单元配置问题

时间:2019-04-15 18:56:53

标签: hadoop hive hiveql external-tables

我有一个未分区的EXTERNAL表:

CREATE EXTERNAL TABLE `db.tableName`(
  `sid` string,
  `uid` int,
  `t1` timestamp,
  `t2` timestamp)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
WITH SERDEPROPERTIES (
  'field.delim'=',',
  'serialization.format'=',')
STORED AS INPUTFORMAT
  'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  's3://<db_location>/tableName'
TBLPROPERTIES (
  'serialization.null.format'='',
  'transient_lastDdlTime'='1551121065')

当我将文件tableName.csv复制到s3://db_location/tableName/tableName.csv并运行msck repair table db.tableName时,计数返回为零。 CSV中有10行,我希望计数会恢复为10。

感谢您的帮助。

0 个答案:

没有答案