收集用于构建机器翻译模型(法语到德语)的数据的方法有哪些

时间:2019-07-10 13:01:59

标签: python neural-network recurrent-neural-network machine-translation

我有很多电子邮件都是法语的,我想将其转换为德语。

现在,我同样需要机器翻译模型,但不确定如何收集数据以创建模型。

开始时准确性较低是可以的,但是我没有找到开始收集数据的方法。

任何人都建议...

1 个答案:

答案 0 :(得分:0)

  

从柏林联邦外交部网站上提取的德法文本。其中包括11,852对,这些对在2013年10月至2015年11月初之间进行了转换,并转换为.TMX文件格式。

https://data.europa.eu/euodp/en/data/dataset/elrc_42