从postgres中的路径中分割出文件名

时间:2012-12-06 19:15:31

标签: sql postgresql

我有一个包含Windows文件路径的字段,如下所示:

\\fs1\foo\bar\snafu.txt
c:\this\is\why\i\drink\snafu.txt
\\fs2\bippity\baz.zip
\\fs3\boppity\boo\baz.zip
c:\users\chris\donut.c

我需要做的是找到重复文件名的数量(无论它们在哪个目录中)。所以我想找到“snafu.txt”和“baz.zip”,但不是donut.c。

PostgreSQL(8.4)中有没有办法找到文件路径的最后一部分?如果我能做到这一点,那么我可以使用count / group来找到我的问题孩子。

3 个答案:

答案 0 :(得分:11)

您可以使用类似

的表达式轻松地将路径剥离到最后一个目录分隔符
regexp_replace(path, '^.+[/\\]', '')

这将匹配某些软件产生的偶数正斜杠。然后你只计算剩下的文件名,如

WITH files AS (
    SELECT regexp_replace(my_path, '^.+[/\\]', '') AS filename
    FROM my_table
)
SELECT filename, count(*) AS count
FROM files
GROUP BY filename
HAVING count(*) >= 2;

答案 1 :(得分:1)

CREATE OR REPLACE FUNCTION basename(text) RETURNS text
    AS $basename$
declare
    FILE_PATH alias for $1;
    ret         text;
begin
    ret := regexp_replace(FILE_PATH,'^.+[/\\]', '');
    return ret;
end;
$basename$ LANGUAGE plpgsql;

答案 2 :(得分:-1)

select regexp_replace(path_field, '.+/', '') from files_table;