应用错误收集

如何使PHP相似字符（）函数适用于日语字符（汉字，片假名和平假名）？

时间：2019-01-22 06:53:59

标签： php character-encoding cjk multibyte

我想使用PHP为日语字符提供的相似文本（）函数。但是不幸的是，它给出了错误的答案。我该如何运作？

例如： similar_text('土橋勇樹', '東日刷株式') 给出输出3，但我们可以清楚地看到它应该为0

1 个答案:

答案 0 :(得分：1)

您将要处理构成汉字字符的可能的多字节。我不是100％自信，但是我怀疑same_text不支持mb，您需要一个可以的类似解决方案。

此链接显示了人们尝试处理类似于php函数的mb char的情况。

https://gist.github.com/soderlind/74a06f9408306cfc5de9

https://github.com/antalaron/mb-similar-text

我还没有亲自测试过，但是这种方法可能是正确的，或者会激发您编写自定义功能。

在另一篇文章中也介绍了

how to use similar text php code in arabic