Question

我有一个表格列numbers，其中包含以下字符串：

1, 2, 2A, 14, 14A, 20

以所需的升序排序顺序列出。

如何制定ORDER BY条款以实现此订单？

默认情况下，postgres必须采用字母顺序，即：

1, 2, 14, 20, 2A, 14A

这可以仅使用Postgres附带的字符串操作功能来完成吗？（replace()，regex_replace()等？）

我的第一个想法是：

剪下这封信（如果有的话）
number * 100
添加字母ascii（如果有）

这将产生所需的结果，因为映射的值将是：

100, 200, 265, 1400, 1465, 2000

我还可以将此操纵值编入索引以加快排序。

其他限制：

我不能使用强制转换为十六进制数字，因为例如：14Z也是有效的。

理想情况下，结果是单个表达式。我需要使用此转换进行过滤和排序，如：

SELECT * FROM table WHERE transform(numbers) < 15 ORDER BY transform(numbers)
RESULT:

 1, 2, 2A, 14, 14A

我尝试使用我从@klin的答案中学到的东西来实现我的想法：

剪切字母并将数字乘以100：

substring('12A' from '(\d+).*')::int*100

剪切数字并获得字母的ASCII码：

ascii(substring('12A' from '\d+([A-Z])'))

添加两个。

这适用于12A，但不适用于12，因为第二个表达式返回NULL而不是0（数字零）。有什么想法吗？

Answer 1

基于这些假设：

数字由数字和可选的一个待处理字母组成。
始终至少有一个前导数字。
所有字母都是大写[A-Z]或小写[a-z]，但不是混合。

我会强制使用表格列上的CHECK约束来绝对可靠。

创建一个小的IMMUTABLE SQL函数：

CREATE OR REPLACE FUNCTION f_nr2sort(text)
  RETURNS int AS
$func$
   SELECT CASE WHEN right($1, 1) > '9' COLLATE "C"  -- no collation
               THEN left($1, -1)::int * 100 + ascii(right($1, 1))
               ELSE $1::int * 100 END  -- only digits
$func$ LANGUAGE SQL IMMUTABLE;

根据上述假设对性能进行了优化。我用更便宜的left() and right()替换了所有正则表达式。

我disabled collation rules with COLLATE "C"表示CASE表达式（也更便宜），以确保ASCII字母的默认字节顺序。 [a-zA-Z]中的字母排在'9'之上，如果是最后一个字母的情况，我们会相应地进行。
这样我们就可以避免添加NULL值，也不需要使用COALESCE进行修复。

然后您的查询可以是：

SELECT *
FROM   tbl
WHERE  f_nr2sort(numbers) < f_nr2sort('15C')
ORDER  BY f_nr2sort(numbers);

由于函数是IMMUTABLE，您甚至可以创建一个简单的functional index来支持这类查询：

CREATE INDEX tbl_foo_id ON tbl (f_nr2sort(numbers));

Answer 2

我是PostgreSQL的新手，但我发现这个非常有用的帖子： Alphanumeric sorting with PostgreSQL

那么这样的事情呢？

select val
from test
order by (substring(val, '^[0-9]+'))::int, substring(val, '[^0-9_].*$') desc

希望有所帮助

postgres替换文本

2 个答案: