用于猜测perl中的文本文件代码页的模式代码?

时间:2015-07-24 18:11:19

标签: perl utf-8 codepages cp1251

对不起我的noob的问题,但我不能让下一个脚本工作。 这是一个有用的代码和平,但我没有在网上找到类似的工作。

use Encode;
use Encode::Guess;

open (my $fhr, "<", "$folder\\$_")
  or die "Could not open file '$folder\\$_' $!";
my $data = do { local $/; <$fhr> };
close $fhr;

# It is either cp1251 or utf-8.
my  $enc = guess_encoding ($data, qw/cp1251/ );
ref($enc) or die "Can't guess: ".$enc->name();
print "Encode = ".$enc->name()."\n";

my $decoded = decode ($enc, $data);

控制台输出如下:

utf8 "\xCE" does not map to Unicode at double_fin.pl line 167, <$fhr> chunk 1.
Encode = utf8
Cannot decode string with wide characters at C:/Dwimperl/perl/lib/Encode.pm line 176.

我做错了什么? 提前谢谢你。

1 个答案:

答案 0 :(得分:1)

第一条消息

utf8 "\xCE" does not map to Unicode at double_fin.pl line 167, <$fhr> chunk 1
perl尝试将文件double_fin.pl的内容解码为UTF-8时,会出现

。但该文件包含无效的UTF-8,因此您需要使用PerlIO图层:raw读取文件,而不是使用:encoding(utf8)图层。

另见http://perldoc.perl.org/PerlIO.html