在Hive中支持国家语言

时间:2014-03-14 22:35:54

标签: hadoop hive

不要在蜂巢中使用nls。更改客户端Linux shell中的语言环境不会影响结果。 谷歌搜索也没有帮助解决。

在Hive中创建表:     创建表wojewodztwa(kod STRING,nazwa STRING,miasto_woj STRING)行格式删除字段由',';

终止

加载数据:

LOAD DATA LOCAL INPATH ./wojewodztwa.txt OVERWRITE INTO TABLE wojewodztwa;

文件wojewodztwa.txt的内容:

02,dolnośląskie,Wrocław
04,kujawsko-pomorskie,Bydgoszcz i Toruń
06,lubelskie,Lublin
08,lubuskie,Gorzów Wielkopolski i Zielona Góra
10,łódzkie,Łódź
12,małopolskie,Kraków
14,mazowieckie,Warszawa
16,opolskie,Opole
18,podkarpackie,Rzeszów
20,podlaskie,Białystok
22,pomorskie,Gdańsk
24,śląskie,Katowice
26,świętokrzyskie,Kielce
28,warmińsko-mazurskie,Olsztyn
30,wielkopolskie,Poznań
32,zachodniopomorskie,Szczecin    

beeline>  !connect jdbc:hive2://172.16.45.211:10001 gpadmin changeme org.apache.hive.jdbc.HiveDriver                      
Connecting to jdbc:hive2://172.16.45.211:10001
Connected to: Hive (version 0.11.0-gphd-2.1.1.0)
Driver: Hive (version 0.11.0-gphd-2.1.1.0)
Transaction isolation: TRANSACTION_REPEATABLE_READ
0: jdbc:hive2://172.16.45.211:10001> select kod,nazwa from wojewodztwa order by nazwa;                                          
+------+----------------------+
| kod  |        nazwa         |
+------+----------------------+
| 02   | dolnośląskie         |
| 04   | kujawsko-pomorskie   |
| 06   | lubelskie            |
| 08   | lubuskie             |
| 14   | mazowieckie          |
| 12   | małopolskie          |
| 16   | opolskie             |
| 18   | podkarpackie         |
| 20   | podlaskie            |
| 22   | pomorskie            |
| 28   | warmińsko-mazurskie  |
| 30   | wielkopolskie        |
| 32   | zachodniopomorskie   |
| 10   | łódzkie              |
| 24   | śląskie              |
| 26   | świętokrzyskie       |
+------+----------------------+
16 rows selected (19,702 seconds)

并且结果不正确,所有以语言特定字符开头的单词都在和。

1 个答案:

答案 0 :(得分:0)

Hive不支持collations。字符串将根据Java String.compareTo规则进行排序。