将中文转换为拼音

时间:2010-08-26 01:38:17

标签: parsing cjk

我在网上发现了http://www.chinesetopinyin.com/等将汉字转换为拼音(罗马字母)的地方。有谁知道如何做到这一点,或者有一个可以解析的数据库?

编辑:我正在使用C#,但实际上更喜欢数据库/平面文件。

4 个答案:

答案 0 :(得分:6)

使用Python的可能解决方案:

我认为Unicode数据库包含中文字符的拼音罗马字母,但unicodedata模块数据中不包含这些内容。

但是,您可以使用一些外部库,例如cjklib,例如:

# coding: UTF-8
import cjklib
from cjklib.characterlookup import CharacterLookup

c = u'好'

cjk = CharacterLookup('T')
readings = cjk.getReadingForCharacter(c, 'Pinyin')
for r in readings:
    print r

输出:

hāo
hǎo
hào

<强>更新

cjklib附带了一个独立的cjknife实用程序,它可以提供帮助。一些用法描述为here

答案 1 :(得分:3)

如果您使用java,则可以使用pinyin4j。

http://pinyin4j.sourceforge.net/

答案 2 :(得分:0)

好的,首先我在这里使用我的问题来获取unicode:

Converting chinese character to Unicode

然后拿这样的文件转换它:http://www.ic.unicamp.br/~stolfi/voynich/Notes/061/uc-to-py.tbl

答案 3 :(得分:-2)

是的,这很容易。请改用Google翻译。它总是同时显示汉字和拼音。这是MS(或Bing)翻译器的一个大缺点。

如果大多数非中国人希望在“实地”(在中文环境中)有任何机会正确发音中文,则需要使用拼音。

同样,解决方案很简单...改为使用Google翻译!