一般来说,它需要Unicode文本并尝试表示它 US-ASCII字符(通用可显示,非重音字符) 通过尝试音译文本表达的发音 在其他一些写罗马字母的书写系统。
前,
"一二三".ooxx => "e-er-san"
在做http://rubygems.org/search?utf8=%E2%9C%93&query=pinyin之后,我得到了一些rubygems,但没有一个能够很好地解决这个问题。
答案 0 :(得分:0)
完美地完成此操作几乎是不可能的,因为一些中文字符有两个或更多发音,例如银行= yin hang,不行= bu xing(最后一个字符相同,在一个上下文中发音为hang而在另一个上下文中为xing)。 ..除此之外,您可以使用unicode数据库滚动自己,我认为它也有发音信息。如果你想要更加花哨,我认为有一些开源输入方法有映射,并且它们也会有它们用于单词,所以如果你找到银行,它会知道第二个字符是挂起的,不是xing。 OpenVanilla可能包含您可以使用的数据库(OSS)。