Unicode和解码字符串之间的区别

时间:2012-10-12 18:08:26

标签: perl unicode decode

decoded strings没有其他属性且Unicode是否可以互换?

更新

如果我写

,它会有所作为吗?
subroutine expects decoded strings.

或写

subroutine expects Unicode strings.

sub subroutine {
    my $unicode = shift;
    utf8::upgrade( $unicode );
    my $gcs = Unicode::GCString->new( $unicode );
    my $colwidth = $gcs->columns();
    return $colwidth;
}

1 个答案:

答案 0 :(得分:1)

假设我们正在谈论解码字符编码(UTF-8,cp1252等),是的。

Encode的decode生成一串Unicode代码点。 “Unicode字符串”是对结果的恰当描述。

请注意,“Unicode字符串”不是“使用UTF8 = 1格式存储的字符串”的合适替代方法。与decode返回的字符串不同,使用UTF8 = 1格式存储的字符串不一定是Unicode代码点的字符串。