如何在java中将tamil字符串转换为英文字符串

时间:2017-01-05 13:58:03

标签: java tamil

我正在做一个涉及NLP的项目。我需要将泰米尔语字符串音译为英语字符串(简洁形式),例如"இல்லை"到" illai" ..

我怎么能用java做到这一点? 帮我处理代码示例

1 个答案:

答案 0 :(得分:1)

由于Tamil block中只有72个字符,因此建立一个转换表,然后通过测试每个字符串来构建一个新字符串,如果字符可以在将其添加到列表之前进行翻译。

例如U+0B87(இ)变为i

如果您更熟悉Java和/或需要翻译大量材料,可能会有一些处理优化来加快这一过程,但我怀疑上述内容将成为一个好的解决方案的基础。

如果您只需要少量材料进行翻译,或者这是一次性工作,那么简单地使用Google Translate并在输入框下方获取输入翻译可能更有意义。