我如何preg_match希伯来语中的单词

时间:2009-12-16 18:28:16

标签: php preg-match

我需要一个匹配希伯来语中完整单词的函数。

请帮忙。

3 个答案:

答案 0 :(得分:6)

试试这个描述Unicode character properties的正则表达式:

/\p{Hebrew}+/u

答案 1 :(得分:5)

假设您的源数据是UTF-8编码

$input = "ט״סת תעסתינג O״ת סOמע העברעו תעחת";

preg_match_all( "/[\\x{0590}-\\x{05FF}]+/u", $input, $matches );

echo '<pre>';
print_r( $matches );
echo '</pre>';

产量

Array
(
    [0] => Array
        (
            [0] => ט״סת
            [1] => תעסתינג
            [2] => ״ת
            [3] => ס
            [4] => מע
            [5] => העברעו
            [6] => תעחת
        )

)

我基于this Unicode chart的0590到05FF的范围(编辑:找到更好的希伯来语/ unicode信息here)。我用this生成了我的示例输入。由于我不知道希伯来语,我实际上无法验证匹配的输出是否有效。

你可能需要调整它,但希望这会让你朝着正确的方向前进。

答案 2 :(得分:2)

感谢您的所有答案,

对我有用的是preg_match(“/ ^ \ p {Hebrew} + $ / u”,“שלום”);