Microsoft转换器集线器添加的文档未出现在Training Dataset中

时间:2018-04-07 16:38:48

标签: training-data microsoft-translator

我添加了多种格式(.pdf,.txt)的单语和双语文档,虽然它们出现在文档选项卡中,但它们并没有出现在Training,Tuning,Testing或Dictionary窗口中,所以我无法选择他们进行初步培训。

1 个答案:

答案 0 :(得分:0)

文档选择由该项目的语言对自动过滤。仅列出与语言对匹配的文档。 对于未在内部标记的文档文件,文档需要在名称中包含语言ID,与您正在处理的项目应用的语言相同。命名规则是

<名称> _<语言>。<对文件类型>

例如:
MyFavoriteFile_fr.pdf
用于法语PDF文档。

PDF,TXT,DOC和DOCX文件未在内部标记,它们需要遵循命名规则。 TMX,XLIFF和XLSX在内部标记。在XLSX中,您只需要在第一行中使用语言ID。

必须以两种语言提供调音,测试和词典。对于未在内部命名的文件,您必须有一对 < samename> _< sourcelanguage>。<对文件类型>
< samename> _< TARGETLANGUAGE>。<对文件类型>

仅限培训使用单语文件是可以接受的。它们必须使用目标语言并进行相应标记。