regexp西里尔文件名不匹配

时间:2014-01-31 14:07:44

标签: php regex preg-match cyrillic

我使用php glob(."*.pdf")获取文件列表。 所有文件都有西里尔字母。例如:ООО«Рогаикопыта»

然后我从数据库加载公司名称并尝试在文件名中找到它们: preg_match("/$firm_name/ui", $file_name, $match);

我有一个问题: 某些公司即使$firm_name在视觉上与$file_name相似,但preg_match表示没有匹配。

两个变量的mb_detect_encoding都返回UTF-8。

文件名中显然存在问题,或者可能存在编码或其他内容,但我无法理解,请求帮助。

UPD:

$file_name='ООО «Рога и копыта»';
preg_match("/... .Рога и копыта./ui", $file_name, $match);

因此,我得到ОО «Рога и копыта»,一个О缺失

0 个答案:

没有答案