我在一列中用逗号分隔数据:
Column
-------
a,b,c,d
我想将逗号分隔数据拆分为多个列以获得此输出:
Column1 Column2 Column3 Column4
------- ------- ------- -------
a b c d
如何实现这一目标?
答案 0 :(得分:86)
split_part()
只需一步即可完成您的工作:
SELECT split_part(col, ',', 1) AS col1
, split_part(col, ',', 2) AS col2
, split_part(col, ',', 3) AS col3
, split_part(col, ',', 4) AS col4
FROM tbl;
添加与col
中的项目一样多的行(可能的最大值)。超出数据项的列将为空字符串(''
)。
答案 1 :(得分:56)
如果CSV中的字段数不变,那么您可以执行以下操作:
select a[1], a[2], a[3], a[4]
from (
select regexp_split_to_array('a,b,c,d', ',')
) as dt(a)
例如:
=> select a[1], a[2], a[3], a[4] from (select regexp_split_to_array('a,b,c,d', ',')) as dt(a);
a | a | a | a
---+---+---+---
a | b | c | d
(1 row)
如果CSV中的字段数不是常数,那么您可以使用以下内容获得最大字段数:
select max(array_length(regexp_split_to_array(csv, ','), 1))
from your_table
然后为您的查询构建相应的a[1], a[2], ..., a[M]
列列表。因此,如果上面给出的最大值为6,那么你可以使用它:
select a[1], a[2], a[3], a[4], a[5], a[6]
from (
select regexp_split_to_array(csv, ',')
from your_table
) as dt(a)
如果需要,您可以将这两个查询合并到一个函数中。
例如,提供此数据(在最后一行中为NULL):
=> select * from csvs;
csv
-------------
1,2,3
1,2,3,4
1,2,3,4,5,6
(4 rows)
=> select max(array_length(regexp_split_to_array(csv, ','), 1)) from csvs;
max
-----
6
(1 row)
=> select a[1], a[2], a[3], a[4], a[5], a[6] from (select regexp_split_to_array(csv, ',') from csvs) as dt(a);
a | a | a | a | a | a
---+---+---+---+---+---
1 | 2 | 3 | | |
1 | 2 | 3 | 4 | |
1 | 2 | 3 | 4 | 5 | 6
| | | | |
(4 rows)
由于您的分隔符是一个简单的固定字符串,您还可以使用string_to_array
代替regexp_split_to_array
:
select ...
from (
select string_to_array(csv, ',')
from csvs
) as dt(a);
感谢Michael有关此功能的提醒。
您真的应该重新设计数据库架构,以便尽可能避免使用CSV列。您应该使用数组列或单独的表。
答案 2 :(得分:1)
您可以使用分割功能。
SELECT
(select top 1 item from dbo.Split(FullName,',') where id=1 ) Column1,
(select top 1 item from dbo.Split(FullName,',') where id=2 ) Column2,
(select top 1 item from dbo.Split(FullName,',') where id=3 ) Column3,
(select top 1 item from dbo.Split(FullName,',') where id=4 ) Column4,
FROM MyTbl