preg_replace括号内的所有西里尔字符

时间:2014-01-15 23:32:56

标签: php preg-replace cyrillic

我需要将所有西里尔字符替换为“[]”括号之间的拉丁语等值。这是一个例子:

Приметимо да
формула (\ref{ј5121}) обухвата
и случајеве а) и б).
Заиста, из (\ref{ј5121}), за $x_1=x_2$
добија се:
\[
|АБ|=\sqrt{(y_2-у_1)^2}=|y_2-п_1|,
\]
а из (\ref{ј5121}), за $y_1=y_2$:
\[
|AЦ|=\sqrt{(м_2-х_1)^2}=|н_2-x_1|.
\]

Стога се формула (\ref{ј5121}) може
применити на било које
двe тачке, без обзира
на њихов положај.

我已设法使用此代码隔离括号之间的内容:     $ pattern =“/ [([^]] *)] /”;     preg_match_all($ pattern,$ string,$ output);

但我不能用拉丁语取代西里尔字符:\欢迎任何形式的帮助。谢谢!

1 个答案:

答案 0 :(得分:2)

您可以使用:

$data = <<<'LOD'
Приметимо да
формула (\ref{ј5121}) обухвата
и случајеве а) и б).
Заиста, из (\ref{ј5121}), за $x_1=x_2$
добија се:
\[
|АБ|=\sqrt{(y_2-у_1)^2}=|y_2-п_1|,
\]
а из (\ref{ј5121}), за $y_1=y_2$:
\[
|AЦ|=\sqrt{(м_2-х_1)^2}=|н_2-x_1|.
\]
LOD;

$pattern = '~(?<=\[)[^]]++(?=])~u';

$result = preg_replace_callback($pattern, function ($m) {
    $cyrillic2latin = array(
        'A'=>'A', 'Б'=>'B', 'В'=>'V', 'Г'=>'G', 'Д'=>'D', 'Е'=>'E',
        'Ё'=>'YO', 'Ж'=>'ZH', 'З'=>'Z', 'И'=>'I', 'Й'=>'J', 'К'=>'K',
        'Л'=>'L', 'М'=>'M', 'Н'=>'N', 'О'=>'O', 'П'=>'P', 'Р'=>'R',
        'С'=>'S', 'Т'=>'T', 'У'=>'U', 'Ф'=>'F', 'Х'=>'H', 'Ц'=>'TS',
        'Ч'=>'CH', 'Ш'=>'SH', 'Щ'=>'SHCH', 'Ъ'=>'\'', 'Э'=>'E', 'Ю'=>'YU',
        'Я'=>'YA');
    return strtr($m[0], $cyrillic2latin);
}, $data);
print_r($result);

随意纠正它并添加小写字母!

如果您使用PHP&gt; = 5.4.0,则可以将函数更改为:

$result = preg_replace_callback($pattern, function ($m) {
    return transliterator_transliterate("Cyrillic-Latin", $m[0]);
}, $data);