摩西训练数据-Corpus

时间:2015-04-08 12:14:13

标签: corpus moses

目前我是摩西的新手,并且已经培训了一些在网站上提供的样本数据集。 我正在寻找更多的数据集来训练系统。 这些是否可在线获取? 在Google上搜索时我应该注意什么?

1 个答案:

答案 0 :(得分:4)

您可以在http://opus.lingfil.uu.se

找到几个语料库

此外,一些开源应用程序包括他们的双语PO文件,但您必须检查许可证。

我的建议是建立一个垂直(即特定领域)的MT系统,而不是通用的系统,以获得更好的结果。所以这个决定会影响你选择的语料库。

我希望这有帮助!