我可以使用IBM Watson Machine Translation API创建自定义域吗?

时间:2016-08-24 10:00:02

标签: ibm-watson

我的目标是为金融领域创建自定义翻译引擎,语言对CHT-EN和CHS-EN。我有各自的词典和对齐的片段,可以导入自定义引擎并训练引擎。

如果我正确理解文档(https://www.ibm.com/watson/developercloud/doc/language-translation/),我只能构建在现有域和语言对之上。因此,对于中文 - 英文,我只能选择专利域并导入我自己的词典和语料库,然后重新训练。不确定,如果这是有道理的,还不清楚我们是在谈论繁体中文还是简体中文。我首先需要传统的中文服务,后来需要简体中文。

另一种选择是建立在财经新闻领域之上,但新闻不适用于中文 - 英文。

我试图找出如何继续并欣赏任何指导的最佳做法。

谢谢!

1 个答案:

答案 0 :(得分:0)

要创建模型,您可以使用具有高频率或高置信度短语翻译的词汇表或平行语料库(TMX文件)。

正如@Nathan所说,如果您使用zh-en-patent作为base_model_id,您将使用unihan支持繁体中文和简体中文。 zh-en-patent是唯一可以使用今天将中文翻译成英文的模型。

以下是有关如何使用IBM Watson Language Translator service创建自定义翻译模型的指南。