应该通过utf8 :: decode对perl的File :: Glob进行后期过滤吗?

时间:2013-08-26 03:42:48

标签: perl unicode utf-8 internationalization

以下最小示例的输出显示(在我的linux机器上)File :: Glob似乎具有将utf8字符串转换为非utf8的意外副作用:

#!/usr/bin/perl 

use utf8;

use strict;

my $x = "påminnelser";
my $y = glob $x;

print "x=",utf8::is_utf8($x),"=\n";
print "y=",utf8::is_utf8($y),"=\n";

这导致我的程序出现错误行为。在linux上,看起来我可以通过在File :: Glob之后应用utf8 :: decode()来修复它。这是解决这个问题的正确方法吗?这是File :: Glob中的错误吗?我的修复程序是否会在Windows等其他系统上产生正确的结果?

1 个答案:

答案 0 :(得分:4)

处理文件名的函数的编码处理目前在perl的todo列表中:Unicode in Filenames。问题是一些流行的操作系统(即Linux)不支持文件名编码(除了使用当前的语言环境设置,但设计已经破坏了),因此在Perl中获得可移植的解决方案并不容易。 / p>

我的建议是完全避免使用非ASCII文件名。