完全混淆MT类别和对模型的影响

时间:2017-07-19 21:44:09

标签: microsoft-translator machine-translation bing-translator-api

我正在尝试在Microsoft Hub中训练引擎,同时利用明显更好的Neural vs SMT技术。在https://translator.microsoft.com/neural/上进行测试时,我很清楚神经系统是我想要的。

但是,@ hub.microsofttranslator.com/Help/Download/Microsoft%20Translator%20Hub%20User%20Guide.pdf中心的文档令人困惑:

第7页,第2.3.1段说明

  

该类别为您的项目标识域 - 您要使用的术语的一般区域。请选择最适合您的文档类型的类别。

     

在某些情况下,您选择的类别会直接影响集线器的行为:

     
      
  • 如果选择“技术”并选择使用Microsoft模型,则集线器将使用与所有其他类别不同的​​基础模型集。
  •   
  • 如果选择“语音”,集线器将使用经过优化的模型来处理语音识别系统的输出。
  •   
  • 任何其他类别选择都使用“常规”Microsoft模型,并在您的类别ID中用作标识符。
  •   

但是在第51页,它与该陈述完全矛盾,并说:

  

问:我在创建项目时选择了“技术”类别。当我为这个项目培训系统时   选中“使用Microsoft模型”选项,培训是否会使用Microsoft的技术模型?

     

答:不。此时,“使用Microsoft模型”的选择总是调用一般的训练数据,与Bing Translator相同。类别选择仅用于识别您的目的,但到目前为止,在培训或翻译期间对行为没有影响。这将在即将发布的版本中发生变化。

有人可以解决这个问题吗?我需要选择哪种类别和“使用MS模型”选项以获得我正在寻找的“好”神经MT输出?

谢谢!

@Chris_Wendt最近在另一篇文章中写道:

  

在API调用中使用参数& category = generalnn将产生与您在Bing UI中看到的相同的结果。注意标记的内容。使用默认类别值,空白或“常规”更好地处理标记。

我正在使用适用于Microsoft翻译的SDL Trados 2017插件。我有办法传递这个参数吗?

[What the plugin looks like]

2 个答案:

答案 0 :(得分:1)

你可以通过" generalnn"或者您在集线器中的类别ID字段中的集线器自定义系统ID,或任何其他允许您设置类别值的TM工具。此时神经系统无法自定义,但您可以像使用自定义系统一样使用它。

答案 1 :(得分:0)

现在可以使用新的preview of Custom Translator自定义神经系统。您需要使用Microsoft Translator Text API v3,自定义转换程序支持NMT languages的语言对。