将HDFS文件加载到Hive中时遇到问题

时间:2020-03-02 05:23:40

标签: r hadoop hive hdfs

我正在尝试使用R Studio将数据写入Hive,为此,我首先将数据存储到HDFS中,然后从那里将数据插入Hive。

HDFS中存储的数据为: [“ TER0626974_achieved”,“ TER0630327_achieved”,“ TER0630520_achieved”,“ TER0537124_achieved”,“ TER0404705_achieved”]

问题:现在问题是从Hive读取数据。

CREATE EXTERNAL TABLE dbname.table_name (
    id string
) ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonSerDe'
STORED AS TEXTFILE 
LOCATION "/hdfs/path/to/file";

我们能够将此结果插入到蜂巢中。但是当尝试阅读时,会出现错误。

archive_data <-dbGetQuery(hivecon,“ SELECT * from Table”).jcall中的错误(rp,“ I”,“ fetch”,大步,块):
org.apache.hive.service.cli.HiveSQLException:java.io.IOException: org.apache.hadoop.hive.serde2.SerDeException:java.io.IOException: 找不到起始令牌

这可能是问题吗? JSON应该以{开头,而不是数组([)?

0 个答案:

没有答案