标签: corpus moses
目前我是摩西的新手,并且已经培训了一些在网站上提供的样本数据集。 我正在寻找更多的数据集来训练系统。 这些是否可在线获取? 在Google上搜索时我应该注意什么?
答案 0 :(得分:4)
您可以在http://opus.lingfil.uu.se
此外,一些开源应用程序包括他们的双语PO文件,但您必须检查许可证。
我的建议是建立一个垂直(即特定领域)的MT系统,而不是通用的系统,以获得更好的结果。所以这个决定会影响你选择的语料库。
我希望这有帮助!