蜂巢中的印地语字符

时间:2018-04-09 06:43:19

标签: apache-spark hive apache-spark-sql

我有一个JSON文件,其某些列值中包含换行符。因此,当我通过Spark SQL在Hive中加载此数据时,我最终使用saveAsTable()创建表而不是直接创建表命令,因为saveAsTable()在Hive中创建表链接同时还存储换行符(通常的插入物是不可能的。)

但是在同一个文件/表中,我有一些印地语语言值(存储在unicode字符(\u****)中。现在我需要在表格中显示这些值,或者至少我需要准备一个select查询可以从此表中提取记录,以便显示印地文语言值。

我了解tblproperties可用于设置表中的characterset以存储hindi值。
但由于我使用saveAsTable而不是通常的create table命令创建我的表,我试图运行 -

alter table node set TBLPROPERTIES('serialization.encoding'='windows-1252')

创建表后只有一个虚拟记录。

但看起来这样做不起作用。

我有办法在印地语中存储或至少提取正确显示的值吗?

0 个答案:

没有答案