日语单词的读数数据库

时间:2009-11-18 20:20:43

标签: sorting nlp

有没有人知道为日语单词提供语音(假名)读数的现成数据库?

3 个答案:

答案 0 :(得分:3)

假设你实际意味着什么是你想要一个计算机可读的离线日语词典,那么看JMDict (或旧法令)是日语词典,其中有阅读条目(在汉字/假名中) )与相关的假名阅读元素。 JMDict是XML格式,因此对大多数项目使用起来非常简单。

答案 1 :(得分:0)

http://kakasi.namazu.org/index.html.ja是另一种选择,但请注意,无论您选择哪种解决方案,映射都不是1到1.如果没有足够的上下文,很多情况下正确的读数都是不明确的。

答案 2 :(得分:-1)

我想到的一个项目是Gozoku,其中包含一个英语< - >日语SQLite数据库,以及日语单词的假名读数。我没有看过架构,但你可能会在那里找到你想要的东西。