Apache Phoenix非法数据异常

时间:2018-10-16 07:20:10

标签: sql hbase phoenix

我在从HBase写入数据并用Phoenix读取数据时遇到问题。 这些是重现该问题的步骤:

使用Phoenix创建表。

 CREATE TABLE test (
    id varchar not null,
    t1.a unsigned_int,
    t1.b varchar
    CONSTRAINT pk PRIMARY KEY (id))
 COLUMN_ENCODED_BYTES = 0;

如果我使用Upsert使用Phoenix向表中添加信息

upsert into test (id, t1.a, t1.b) values ('a1',1,'foo_a');

然后我尝试查询表,我得到了:

select * from test;

+-----+----+--------+
| ID  | A  |   B    |
+-----+----+--------+
| a1  | 1  | foo_a  |
+-----+----+--------+

目前一切正常,但是现在我将直接使用HBase添加一个新条目。

put 'TEST', 'id_1','T1:A', 2
put 'TEST', 'id_1','T1:B','some text'

此后,我无法再查询该表,得到这个:

select * from test;
Error: ERROR 201 (22000): Illegal data. Expected length of at least 4 bytes, but had 1 (state=22000,code=201)

我知道问题与HBase如何存储unsigned_int有关,如果我从表中删除此列,查询将再次起作用。 该问题如何解决?

1 个答案:

答案 0 :(得分:0)

问题似乎与HBase如何存储数据有关,如果我对表进行扫描,则会得到以下信息:

ROW                           COLUMN+CELL
 a1                           column=T1:A, timestamp=1551274930165, value=\x00\x00\x00\x01
 a1                           column=T1:B, timestamp=1551274930165, value=foo_a
 a1                           column=T1:_0, timestamp=1551274930165, value=x
 id_1                         column=T1:A, timestamp=1551274993067, value=2
 id_1                         column=T1:B, timestamp=1551275070577, value=some text

这意味着新的整数值将作为字符串存储,因此正确的存储方式应为:

put 'TEST', 'id_1','T1:A', "\x00\x00\x00\x02"

完成此操作后,扫描将为我们提供:

ROW                           COLUMN+CELL
 a1                           column=T1:A, timestamp=1551274930165, value=\x00\x00\x00\x01
 a1                           column=T1:B, timestamp=1551274930165, value=foo_a
 a1                           column=T1:_0, timestamp=1551274930165, value=x
 id_1                         column=T1:A, timestamp=1551274993067, value=\x00\x00\x00\x02
 id_1                         column=T1:B, timestamp=1551275070577, value=some text

Phoenix可以毫无问题地访问数据。
感谢鲍里斯的提示。