如何使PHP相似字符()函数适用于日语字符(汉字,片假名和平假名)?

时间:2019-01-22 06:53:59

标签: php character-encoding cjk multibyte

我想使用PHP为日语字符提供的相似文本()函数。但是不幸的是,它给出了错误的答案。我该如何运作?

例如:     similar_text('土橋勇樹', '東日刷株式') 给出输出3,但我们可以清楚地看到它应该为0

1 个答案:

答案 0 :(得分:1)

您将要处理构成汉字字符的可能的多字节。我不是100%自信,但是我怀疑same_text不支持mb,您需要一个可以的类似解决方案。

此链接显示了人们尝试处理类似于php函数的mb char的情况。

https://gist.github.com/soderlind/74a06f9408306cfc5de9

https://github.com/antalaron/mb-similar-text

我还没有亲自测试过,但是这种方法可能是正确的,或者会激发您编写自定义功能。

在另一篇文章中也介绍了

how to use similar text php code in arabic