在Hive 0.8 with Hadoop 1.03中考虑此表:
CREATE TABLE table (
key int,
date timestamp,
name string,
surname string,
height int,
weight int,
age int)
CLUSTERED BY(key) INTO 128 BUCKETS
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';
然后我尝试了:
select *
from table
where key=xxx
order by date;
结果已排序,但列名后面的所有内容都是错误的。实际上,所有行在相应字段中具有完全相同的值,并且缺少姓氏列。我还有名称和姓氏的位图索引以及键的索引。
我的查询是否有问题,或者我应该查看有关订单的错误(我无法找到具体的内容)。
答案 0 :(得分:0)
似乎将数据加载到配置单元时出错。确保CSV文件中没有任何可能干扰插入的特殊字符。
你已经通过关键属性进行了聚类。这个密钥来自CSV?还是其他一些来源?你确定这是独一无二的吗?