"关闭" binmode(STDOUT,":utf8")本地

时间:2015-01-06 15:15:22

标签: perl utf-8 local binmode

我的脚本开头有以下块:

#!/usr/bin/perl5 -w
use strict;
binmode(STDIN, ":utf8");
binmode(STDOUT, ":utf8");
binmode(STDERR, ":utf8");

在某些子程序中,当存在其他编码时(来自远程子程序),当接收西里尔字符或其他字符时,数据将无法正确显示。它是" binmode",导致问题。

我可以"关闭"本地的binmode utf8,仅适用于子程序?

我无法移除全局binmode设置,但我无法更改远程编码。

3 个答案:

答案 0 :(得分:5)

实现这一目标的一种方法是" dup" STD句柄,设置重复的文件句柄以使用:raw图层,并将其分配给STD句柄的本地版本。例如,以下代码

binmode(STDOUT, ':utf8');
print(join(', ', PerlIO::get_layers(STDOUT)), "\n");

{
    open(my $duped, '>&', STDOUT);
    # The ':raw' argument could also be omitted.
    binmode($duped, ':raw');
    local *STDOUT = $duped;
    print(join(', ', PerlIO::get_layers(STDOUT)), "\n");
    close($duped);
}

print(join(', ', PerlIO::get_layers(STDOUT)), "\n");

打印

unix, perlio, utf8
unix, perlio
unix, perlio, utf8

在我的系统上。

答案 1 :(得分:3)

我喜欢@ nwellnhof的方法。只处理Unicode和ASCII - 很少有人喜欢 - 我的本能是保留字节,并在需要时有选择地使用Encodedecode()/encode()。如果您能够确定哪些数据源存在问题,则可以在处理时过滤/插入decode

% file koi8r.txt 
koi8r.txt: ISO-8859 text
% cat koi8r.txt 
������ �� ����� � ������� ���. ���
���� ����� ������ ����� �����.
% perl -CO -MEncode="encode,decode" -E 'decode("koi8-r", <>) ;' koi8-r.txt
Американские суда находятся в международных водах. Япония

答案 2 :(得分:0)

您可以使用https://momentjs.com/docs/#/displaying/as-iso-string/之类的方法来确保在离开示波器时将其重新设置为:utf8,无论如何(返回,死亡或其他):

#!/usr/bin/perl -w
use strict;

use Scope::Guard qw(guard);

binmode(STDOUT, ':utf8');
print(join(', ', PerlIO::get_layers(STDOUT)), "\n");

{
    # When guard goes out of scope, this sub is guaranteed to be called:
    my $guard = guard {
        binmode(STDOUT, ':utf8');
    };
    binmode(STDOUT, ':raw');
    print(join(', ', PerlIO::get_layers(STDOUT)), "\n");
}

print(join(', ', PerlIO::get_layers(STDOUT)), "\n");

或者,如果您不想包括像Scope :: Guard这样的新依赖项(Scope :: Guard对于这种本地化功能来说是很棒的...):

#!/usr/bin/perl -w
use strict;

binmode(STDOUT, ':utf8');
print(join(', ', PerlIO::get_layers(STDOUT)), "\n");

{
    my $guard = PoorMansGuard->new(sub {
        binmode(STDOUT, ':utf8');
    });
    binmode(STDOUT, ':raw');
    print(join(', ', PerlIO::get_layers(STDOUT)), "\n");
}

print(join(', ', PerlIO::get_layers(STDOUT)), "\n");

package PoorMansGuard;

sub new {
    my ($class, $sub) = @_;
    bless { sub => $sub }, $class;
}

sub DESTROY {
    my ($self) = @_;
    $self->{sub}->();
}