蜂巢java.lang.AssertionError:选择分区列时

时间:2020-07-30 08:17:30

标签: dataframe pyspark hive apache-spark-sql

我面临一个奇怪的问题。 我有一个带有分区源,年,月,日的蜂巢表

所有列的数据类型均为字符串。

当我选择一个不同的(源)时,我得到了预期的结果。

select distinct(source) from table;

enter image description here

但是当我在源代码上放置where条件时

select count(*) from table where source="s"

我遇到类似 java.lang.AssertionError的错误:未填充24的索引

第二期

当我在年,月,日列上运行where条件时,我会得到相同的断言错误

select count(*) from table where year="2020"

但是当我跑步

select count(*) from table where year=2020

我得到了预期的结果。

我不确定我在这里缺少什么。我已经对表做了描述,年份的数据类型是字符串。

我正在通过执行select语句类似的spark工作来创建配置单元表

select source as source,
year as year
from table

预先感谢

0 个答案:

没有答案