我正在使用双metaphone算法(apache实现,common-codec)来编码用户 名称,但在我的情况下,用户名可以是任何语言,例如中文,韩文,日文,法文等。如果我使用双变音符编码非英文名称会发生什么?特别是罗马语,例如法语,意大利语,如他们熟悉英语,据我所知,双变音符算法适用于英语
除了this.do你们有任何想法如何判断属于哪种语言的java字符串?
e.g 英语:“你好”
法语: “的Bonjour”
德语: “喂”
我们能否知道“hallo”这个词是德语“你好”还是只是一首英文歌的名字?