使用亚洲语言的split_part拆分字符串

时间:2017-12-04 16:12:31

标签: sql postgresql split southeast-asian-languages

我有一个包含亚洲地址的专栏。我想提取子字符串直到第一个空格。但是,这在这里不起作用。我怀疑它与亚洲语言有关,但我不知道为什么也不知道如何处理这个问题。

这就是代码:

:\s+\*(?<T1>.*)UTC:\s%+(?<T2>.*)

示例性输出(没有发生分裂!)。如你所见,有空格。

select address, split_part(address, ' ', 1) from asian

1 个答案:

答案 0 :(得分:1)

您可以使用chr()破解ideographic space,例如:

t=# select split_part('千葉県富津市新富20−1 新日本製鐵株式会社 技術開発本部内',chr(12288),1);
       split_part
-------------------------
 千葉県富津市新富20−1
(1 row)

t=# select split_part('千葉県富津市新富20−1 新日本製鐵株式会社 技術開発本部内',chr(12288),2);
     split_part
--------------------
 新日本製鐵株式会社
(1 row)