标签: c# java string language-agnostic nlp
我希望用字母/元音翻译单词。 我会试着解释一下。 我有一个约300,000字的阿拉伯语文本,我的目标是让用户使用我定义的10种语言中的一种来搜索文本。因此,如果有人用英语搜索Stack溢出,我需要将其分解为S-TA-CK O-VE-R-F-LOW(我需要打破它以获得阿拉伯语等效字母)。 有没有类似的东西已经存在,或者我只需要从头开始做语言研究??? 谢谢你的时间。
答案 0 :(得分:0)
您需要通过查找相对音节来分析您的单词。看一下Sphinx-4 Java库,我想有一些示例代码可以根据定义的语法规则将单词提取到其音节。