我面临一个奇怪的问题。 我有一个带有分区源,年,月,日的蜂巢表
所有列的数据类型均为字符串。
当我选择一个不同的(源)时,我得到了预期的结果。
select distinct(source) from table;
但是当我在源代码上放置where条件时
select count(*) from table where source="s"
我遇到类似 java.lang.AssertionError的错误:未填充24的索引
第二期
当我在年,月,日列上运行where条件时,我会得到相同的断言错误
select count(*) from table where year="2020"
但是当我跑步
select count(*) from table where year=2020
我得到了预期的结果。
我不确定我在这里缺少什么。我已经对表做了描述,年份的数据类型是字符串。
我正在通过执行select语句类似的spark工作来创建配置单元表
select source as source,
year as year
from table
预先感谢