我应该在执行语言翻译时保留html标记(即通过MS翻译API)吗?

时间:2013-09-18 15:41:15

标签: translation bing-api language-translation

将html片段传递给翻译API是否有任何优势,而不仅仅是纯文本。例如,翻译以下内容

Please click <a href='#'>here</a> to continue

返回一个有效的,已翻译的html片段 - 但是幕后会发生什么?返回的翻译是否等同于三个句子片段的翻译

Please click&gt; here&gt; to continue

或单句

Please click here to continue

我为什么这么问? 我有一个或两个大于允许大小的html片段,我需要以某种方式将它们分块。使用htmlagilitypack我可以用翻译的等效值替换html文档文本节点,但这样做会丢失任何东西吗?如果我翻译整个句子(即<H1><H2><p>标签),翻译质量会提高吗?

非常感谢提前

邓肯

1 个答案:

答案 0 :(得分:0)

来自MSDN here我收到了以下回复:

  

在翻译中,句子边界所在的位置很重要。 HTML   标记具有句子内部元素,如<em><a>和句子   破坏元素,如<p>。 HTML模式将处理元素   根据他们在HTML文档渲染中的行为。

就是这样!