应用错误收集

IBM Watson语言翻译 - 使用平行语料库训练的正确方法

时间：2017-03-18 09:22:31

标签： ibm-cloud ibm-watson machine-translation

我有一堆已翻译的文章，我想将它们用作IBM Watson语言翻译的培训数据。使用这些文章进行培训的正确方法是什么？我是否将整篇文章及其翻译用作平行语料库中的条目，或者我是否必须将文章拆分为句子并将其翻译对作为条目？

1 个答案:

答案 0 :(得分：2)

你有两个选择。

将文本拆分为每个短语的from和to的短语对，并创建forced_glossary或parallel_corpus。

或者将所有翻译后的文本作为单个文件发送，以创建monolingual_corpus。

https://www.ibm.com/watson/developercloud/doc/language-translator/customizing.html#training提供了详细的文档 API文档可在https://www.ibm.com/watson/developercloud/language-translator/api/v2/?curl#create-model

获取