将汉字解析为可能的CJK发音/索引?

时间:2018-10-03 03:16:41

标签: nlp cjk

我正在制作一个组织程序(用C#语言编写),并且正在尝试为CJK(以及越南语,如果可能)建立索引功能。

如果有中文字符串,我想将其解析为可能的中文拼音/注音,笔画,韩文韩文,日语平假名或越南语索引。

例如,在wiktionary page中使用汉字RecursiveAction,它可能被解析为:

  • 汉语拼音,索引属于
  • 中文注音D,索引属于ㄉㄨˊ
  • 日语,索引属于よむ
  • 韩文索引
  • 越南语,索引属于đọc
  • 它有22招。

我知道并非所有汉字都可能具有一对一的映射,至少我可能会选择一个可能的/第一个映射。

是否建议使用任何现有的库或映射功能?

0 个答案:

没有答案