我的请求似乎有点复杂,但我认为这个想法是:
我想检查一个字符串并考虑是否是日语...但是基于字符串中的日文字符数量(平假名,片假名或汉字)。
示例:
> "Hi Johnさん, thank you very much." -> Show as Non Japanese
> "ジョン様、ありがとうございました。" -> Show as Japanese "John-san,ありがとうございました!" ->
> Show as Japanese "John-san, Thank you very much! すごいね!" -> Show as
> Non Japanese
对于我现在使用的情况,通过使用带有preg_match的正则表达式检查,它会自动考虑日语,如果只包含一个汉字/平假名/片假名字符。 任何想法如何检查罗马+日语(或亚洲字符)的文本,并定义语言考虑有更多的语言?
我也可能对中国人和韩国人也适用同样的想法。
有什么想法吗?谢谢。