Google Translate v3 API中的词汇表

时间:2019-06-21 15:36:22

标签: google-cloud-automl

通过Google translation_v3beta1 API对词汇表的支持应该如何工作?我一直在搜索此信息,但尚未找到。词汇表中的术语是否应该简单地覆盖所有其他可能的翻译,还是只是为词汇表中的翻译添加优先级,但是如果引擎根据训练数据“更合适”,引擎仍然可以使用其他翻译?

我已经使用Python库创建了一个词汇表(我尝试了两种不同的方式-从使用“ language_pair”属性的tsv和从使用“ language_codes_set”属性的csv开始)。然后,我尝试使用词汇表覆盖自定义MT模型生成的文本字符串中一个术语的翻译(即,不使用词汇表,引擎以一种方式翻译了一个术语,然后我尝试使用词汇表将其强制转换为使用该词的另一种翻译),但没有成功。

现在,我不确定,是否在创建或使用词汇表时犯了一些错误(当前我对代码中的任何问题一无所知),或者我没有错,但是基于训练数据引擎仅使用了另一种翻译。从用于定制机器翻译的其他平台的经验中,我知道,其中一些平台使用词汇表来覆盖翻译,而某些平台仅使用它们来对词汇表术语进行优先级排序,而不能完全覆盖所有其他潜在的翻译。因此,在开始搜索其他可能原因之前,我想先澄清这个简单的问题,为什么我的代码无法按预期工作。

谢谢。

1 个答案:

答案 0 :(得分:1)

好的,所以我在其他地方得到了答案。词汇表的翻译应优先于模型使用的术语。还有一个原因为什么它对我不起作用(我在响应中使用了不正确的字段-“ translation”而不是“ glossaryTranslation”)。