我正在寻找建议我应该使用哪些库和/或函数将国际文本转换为它的英文字符替代。
例如
Vous avez aimé l'épée offerte par les elfes à Frodon
转换为
Vous avez aime l'epee offerte par les elfes a Frodon
答案 0 :(得分:12)
首先,您可以使用Unicode::Normalize分解字符,然后您可以使用简单的正则表达式删除所有变音符号。 (我想简单地抓住所有非间距标记字符就应该这样做,但可能会有一两个不起眼的例外。)
以下是一个例子:
use strict;
use warnings;
use utf8;
use Unicode::Normalize;
my $test = "Vous avez aimé l'épée offerte par les elfes à Frodon";
my $decomposed = NFKD( $test );
$decomposed =~ s/\p{NonspacingMark}//g;
print $decomposed;
输出:
Vous avez aime l'epee offerte par les elfes a Frodon