我需要一个匹配希伯来语中完整单词的函数。
请帮忙。
答案 0 :(得分:6)
试试这个描述Unicode character properties的正则表达式:
/\p{Hebrew}+/u
答案 1 :(得分:5)
假设您的源数据是UTF-8编码
$input = "ט״סת תעסתינג O״ת סOמע העברעו תעחת";
preg_match_all( "/[\\x{0590}-\\x{05FF}]+/u", $input, $matches );
echo '<pre>';
print_r( $matches );
echo '</pre>';
产量
Array
(
[0] => Array
(
[0] => ט״סת
[1] => תעסתינג
[2] => ״ת
[3] => ס
[4] => מע
[5] => העברעו
[6] => תעחת
)
)
我基于this Unicode chart的0590到05FF的范围(编辑:找到更好的希伯来语/ unicode信息here)。我用this生成了我的示例输入。由于我不知道希伯来语,我实际上无法验证匹配的输出是否有效。
你可能需要调整它,但希望这会让你朝着正确的方向前进。
答案 2 :(得分:2)
感谢您的所有答案,
对我有用的是preg_match(“/ ^ \ p {Hebrew} + $ / u”,“שלום”);