我们正在寻找可以纳入我们的本地化工作流程的开源机器翻译引擎。我们正在考虑以下选项:
答案 0 :(得分:5)
我认为,在摩西邮件列表(moses-support@mit.edu)上可以更好地提出这个问题。那里有很多人使用不同类型的系统,所以你会得到一个客观的答案。除此之外,这是我的意见:
以下是您的功能请求的一些输入:
希望这会有所帮助。如果您还有其他问题,请随时与我联系。
答案 1 :(得分:5)
很多事情都在向前推进,所以我想提供一个关于这个主题的更新,并在那里留下前面的答案来记录进展。
特定领域培训:如果您的数据来自各种来源,并且您需要针对子域进行优化,则域适应技术非常有用。根据我们的经验,没有一种解决方案始终表现最佳,因此您需要尝试尽可能多的方法并比较结果。 Moses邮件列表上有一个邮件列出了可能的方法:http://thread.gmane.org/gmane.comp.nlp.moses.user/9742/focus=9799various。以下页面还概述了当前的研究:http://www.statmt.org/survey/Topic/DomainAdaptation
增量培训:IWSLT 2013上有一个有趣的演讲:http://www.iwslt2013.org/downloads/Assessing_Quick_Update_Methods_of_Statistical_Translation_Models.pdf它表明当前的增量方法(1)使您的系统脱机,因此您的模型没有真正的“实时更新”(2)完全重新训练的表现优于其他人。似乎问题还没有解决。
并行化翻译过程:moses服务器在moses-cmd二进制文件上落后。因此,如果您想使用最新功能,最好从moses-cmd开始。此外,社区还没有履行其永不发布1.0版本的承诺:-)。实际上,您可以在此处找到最新版本(2.1):http://www.statmt.org/moses/?n=Moses.Releases