删除重音字符的重音符号

时间:2013-07-10 03:07:40

标签: perl

我正在寻找建议我应该使用哪些库和/或函数将国际文本转换为它的英文字符替代。

例如

Vous avez aimé l'épée offerte par les elfes à Frodon 

转换为

Vous avez aime l'epee offerte par les elfes a Frodon 

1 个答案:

答案 0 :(得分:12)

首先,您可以使用Unicode::Normalize分解字符,然后您可以使用简单的正则表达式删除所有变音符号。 (我想简单地抓住所有非间距标记字符就应该这样做,但可能会有一两个不起眼的例外。)

以下是一个例子:

use strict;
use warnings;
use utf8;

use Unicode::Normalize;

my $test = "Vous avez aimé l'épée offerte par les elfes à Frodon";

my $decomposed = NFKD( $test );
$decomposed =~ s/\p{NonspacingMark}//g;

print $decomposed;

输出:

Vous avez aime l'epee offerte par les elfes a Frodon