我在网上发现了http://www.chinesetopinyin.com/等将汉字转换为拼音(罗马字母)的地方。有谁知道如何做到这一点,或者有一个可以解析的数据库?
编辑:我正在使用C#,但实际上更喜欢数据库/平面文件。答案 0 :(得分:6)
使用Python的可能解决方案:
我认为Unicode数据库包含中文字符的拼音罗马字母,但unicodedata
模块数据中不包含这些内容。
但是,您可以使用一些外部库,例如cjklib,例如:
# coding: UTF-8
import cjklib
from cjklib.characterlookup import CharacterLookup
c = u'好'
cjk = CharacterLookup('T')
readings = cjk.getReadingForCharacter(c, 'Pinyin')
for r in readings:
print r
输出:
hāo
hǎo
hào
<强>更新强>
cjklib附带了一个独立的cjknife
实用程序,它可以提供帮助。一些用法描述为here
答案 1 :(得分:3)
如果您使用java,则可以使用pinyin4j。
答案 2 :(得分:0)
好的,首先我在这里使用我的问题来获取unicode:
Converting chinese character to Unicode
然后拿这样的文件转换它:http://www.ic.unicamp.br/~stolfi/voynich/Notes/061/uc-to-py.tbl
答案 3 :(得分:-2)
是的,这很容易。请改用Google翻译。它总是同时显示汉字和拼音。这是MS(或Bing)翻译器的一个大缺点。
如果大多数非中国人希望在“实地”(在中文环境中)有任何机会正确发音中文,则需要使用拼音。
同样,解决方案很简单...改为使用Google翻译!