我有一个表格列numbers
,其中包含以下字符串:
1, 2, 2A, 14, 14A, 20
以所需的升序排序顺序列出。
如何制定ORDER BY
条款以实现此订单?
默认情况下,postgres必须采用字母顺序,即:
1, 2, 14, 20, 2A, 14A
这可以仅使用Postgres附带的字符串操作功能来完成吗? (replace()
,regex_replace()
等?)
我的第一个想法是:
这将产生所需的结果,因为映射的值将是:
100, 200, 265, 1400, 1465, 2000
我还可以将此操纵值编入索引以加快排序。
其他限制:
我不能使用强制转换为十六进制数字,因为例如:14Z
也是有效的。
理想情况下,结果是单个表达式。我需要使用此转换进行过滤和排序,如:
SELECT * FROM table WHERE transform(numbers) < 15 ORDER BY transform(numbers)
RESULT:
1, 2, 2A, 14, 14A
我尝试使用我从@klin的答案中学到的东西来实现我的想法:
剪切字母并将数字乘以100:
substring('12A' from '(\d+).*')::int*100
剪切数字并获得字母的ASCII码:
ascii(substring('12A' from '\d+([A-Z])'))
添加两个。
这适用于12A
,但不适用于12
,因为第二个表达式返回NULL
而不是0
(数字零)。有什么想法吗?
答案 0 :(得分:3)
基于这些假设:
[A-Z]
或小写[a-z]
,但不是混合。我会强制使用表格列上的CHECK
约束来绝对可靠。
创建一个小的IMMUTABLE
SQL函数:
CREATE OR REPLACE FUNCTION f_nr2sort(text)
RETURNS int AS
$func$
SELECT CASE WHEN right($1, 1) > '9' COLLATE "C" -- no collation
THEN left($1, -1)::int * 100 + ascii(right($1, 1))
ELSE $1::int * 100 END -- only digits
$func$ LANGUAGE SQL IMMUTABLE;
根据上述假设对性能进行了优化。我用更便宜的left()
and right()
替换了所有正则表达式。
我disabled collation rules with COLLATE "C"
表示CASE
表达式(也更便宜),以确保ASCII字母的默认字节顺序。 [a-zA-Z]
中的字母排在'9'之上,如果是最后一个字母的情况,我们会相应地进行。
这样我们就可以避免添加NULL值,也不需要使用COALESCE
进行修复。
然后您的查询可以是:
SELECT *
FROM tbl
WHERE f_nr2sort(numbers) < f_nr2sort('15C')
ORDER BY f_nr2sort(numbers);
由于函数是IMMUTABLE
,您甚至可以创建一个简单的functional index来支持这类查询:
CREATE INDEX tbl_foo_id ON tbl (f_nr2sort(numbers));
答案 1 :(得分:0)
我是PostgreSQL的新手,但我发现这个非常有用的帖子: Alphanumeric sorting with PostgreSQL
那么这样的事情呢?
select val
from test
order by (substring(val, '^[0-9]+'))::int, substring(val, '[^0-9_].*$') desc
希望有所帮助