我有一个JSON文件,其某些列值中包含换行符。因此,当我通过Spark SQL在Hive中加载此数据时,我最终使用saveAsTable()
创建表而不是直接创建表命令,因为saveAsTable()
在Hive中创建表链接同时还存储换行符(通常的插入物是不可能的。)
但是在同一个文件/表中,我有一些印地语语言值(存储在unicode字符(\u****
)中。现在我需要在表格中显示这些值,或者至少我需要准备一个select
查询可以从此表中提取记录,以便显示印地文语言值。
我了解tblproperties
可用于设置表中的characterset
以存储hindi值。
但由于我使用saveAsTable
而不是通常的create table命令创建我的表,我试图运行 -
alter table node set TBLPROPERTIES('serialization.encoding'='windows-1252')
创建表后只有一个虚拟记录。
但看起来这样做不起作用。
我有办法在印地语中存储或至少提取正确显示的值吗?