我正在尝试在Microsoft Hub中训练引擎,同时利用明显更好的Neural vs SMT技术。在https://translator.microsoft.com/neural/上进行测试时,我很清楚神经系统是我想要的。
但是,@ hub.microsofttranslator.com/Help/Download/Microsoft%20Translator%20Hub%20User%20Guide.pdf中心的文档令人困惑:
第7页,第2.3.1段说明
该类别为您的项目标识域 - 您要使用的术语的一般区域。请选择最适合您的文档类型的类别。
在某些情况下,您选择的类别会直接影响集线器的行为:
- 如果选择“技术”并选择使用Microsoft模型,则集线器将使用与所有其他类别不同的基础模型集。
- 如果选择“语音”,集线器将使用经过优化的模型来处理语音识别系统的输出。
- 任何其他类别选择都使用“常规”Microsoft模型,并在您的类别ID中用作标识符。
但是在第51页,它与该陈述完全矛盾,并说:
问:我在创建项目时选择了“技术”类别。当我为这个项目培训系统时 选中“使用Microsoft模型”选项,培训是否会使用Microsoft的技术模型?
答:不。此时,“使用Microsoft模型”的选择总是调用一般的训练数据,与Bing Translator相同。类别选择仅用于识别您的目的,但到目前为止,在培训或翻译期间对行为没有影响。这将在即将发布的版本中发生变化。
有人可以解决这个问题吗?我需要选择哪种类别和“使用MS模型”选项以获得我正在寻找的“好”神经MT输出?
谢谢!
@Chris_Wendt最近在另一篇文章中写道:
在API调用中使用参数& category = generalnn将产生与您在Bing UI中看到的相同的结果。注意标记的内容。使用默认类别值,空白或“常规”更好地处理标记。
我正在使用适用于Microsoft翻译的SDL Trados 2017插件。我有办法传递这个参数吗?
[
答案 0 :(得分:1)
你可以通过" generalnn"或者您在集线器中的类别ID字段中的集线器自定义系统ID,或任何其他允许您设置类别值的TM工具。此时神经系统无法自定义,但您可以像使用自定义系统一样使用它。
答案 1 :(得分:0)
现在可以使用新的preview of Custom Translator自定义神经系统。您需要使用Microsoft Translator Text API v3,自定义转换程序支持NMT languages的语言对。