我有一堆已翻译的文章,我想将它们用作IBM Watson语言翻译的培训数据。使用这些文章进行培训的正确方法是什么?我是否将整篇文章及其翻译用作平行语料库中的条目,或者我是否必须将文章拆分为句子并将其翻译对作为条目?
答案 0 :(得分:2)
你有两个选择。
将文本拆分为每个短语的from和to的短语对,并创建forced_glossary或parallel_corpus。
或者将所有翻译后的文本作为单个文件发送,以创建monolingual_corpus。
https://www.ibm.com/watson/developercloud/doc/language-translator/customizing.html#training提供了详细的文档 API文档可在https://www.ibm.com/watson/developercloud/language-translator/api/v2/?curl#create-model
获取