我想使用PHP为日语字符提供的相似文本()函数。但是不幸的是,它给出了错误的答案。我该如何运作?
例如:
similar_text('土橋勇樹', '東日刷株式')
给出输出3,但我们可以清楚地看到它应该为0
答案 0 :(得分:1)
您将要处理构成汉字字符的可能的多字节。我不是100%自信,但是我怀疑same_text不支持mb,您需要一个可以的类似解决方案。
此链接显示了人们尝试处理类似于php函数的mb char的情况。
https://gist.github.com/soderlind/74a06f9408306cfc5de9
https://github.com/antalaron/mb-similar-text
我还没有亲自测试过,但是这种方法可能是正确的,或者会激发您编写自定义功能。
在另一篇文章中也介绍了