应用错误收集

我的请求似乎有点复杂，但我认为这个想法是：

我想检查一个字符串并考虑是否是日语...但是基于字符串中的日文字符数量（平假名，片假名或汉字）。

示例：

> "Hi Johnさん, thank you very much." -> Show as Non Japanese
> "ジョン様、ありがとうございました。"   -> Show as Japanese "John-san,ありがとうございました！"   ->
> Show as Japanese "John-san, Thank you very much! すごいね！"  -> Show as
> Non Japanese

对于我现在使用的情况，通过使用带有preg_match的正则表达式检查，它会自动考虑日语，如果只包含一个汉字/平假名/片假名字符。任何想法如何检查罗马+日语（或亚洲字符）的文本，并定义语言考虑有更多的语言？

我也可能对中国人和韩国人也适用同样的想法。

有什么想法吗？谢谢。

识别语言是否为日语但是要验证其他语言的字符数量

0 个答案: