PHP单词边界/ b正则表达式不适用于法语

时间:2017-08-13 14:45:49

标签: php regex preg-replace preg-match french

我试图将句子“çavousdit quoi”与正则表达式匹配:

$pattern=(\b".$value."\b)

除了法语专属字符(如ça开头的ç)之外,单词边界可以使用。我可以通过更改PHP语言环境来解决单词边界问题:

setlocale(LC_ALL, 'fr_FR');

当我这样做时,它成功匹配句子,但所有法语字符都显示为 所以我得到:

�a vous dit quoi

有点烦人。解决一个问题只是为了创造另一个问题。我已经将html语言环境设置为:

<html xmlns="http://www.w3.org/1999/xhtml" lang="fr" xml:lang="fr" version="XHTML+RDFa 1.0" dir="ltr">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

不确定还需要做些什么来解决这个问题?肯定法语应该显示确定所有语言设置为法语...?

编辑:我的服务器通过phpinfo显示UTF-8作为本地和主值的默认字符集。

编辑:这个问题与建议的问题不相似,因为这个问题根本不相似。解决方案可能是相同的,但任何人在谷歌搜索我遇到的那种问题都不会找到这个问题,但他们会找到我的。我认为人们开始只是为了它而将问题标记为重复。

这个问题也和我的问题类似,因为答案是一样的: regular expression for French characters 但这会使所有三个问题重复。

1 个答案:

答案 0 :(得分:0)

这似乎是一个修复噩梦的噩梦?在法语区域设置中显示,但我能够通过修改正则表达式模式以另一种方式解决此问题。通过在模式中添加“u”作为修饰符,它能够检测到ça中的法语字符ç,并且所有工作都正常,无需更改语言环境。

由此:

$pattern=(\b".$value."\b)

到此:

$pattern=(\b".$value."\b/u)