从Google Translate API的字符串中临时删除HTML以降低成本

时间:2012-07-18 12:55:37

标签: php api html-parsing translation google-translate

我必须使用我们付费的Google API翻译一些细节。详细信息包含HTML和每个字符的Google费用。我不想发送完整的内容,而只发送英文文本,删除HTML。我可以使用PHP函数删除HTML标记和实体,但是我必须在翻译后将英文内容放回HTML标记中以便正确显示。它还将包括CSS。

示例:

<strong>This is a test</strong><br /> &nbsp; <custom tag>This is a test</custom tag><br />

翻译成西班牙语后,我需要:

<strong>Translated content </strong><br /> &nbsp; <p>Translated content </p><br />

如何在不向API发送HTML的情况下保留HTML格式?

2 个答案:

答案 0 :(得分:1)

哈哈,我也有这个问题。但它刚刚发生......

我认为,有一个问题 - 由于翻译性质 - 一些句子被交换。所以我首先无法将标签放在同一个位置。但我认为有一种方法可以从翻译过程中获取一些元数据,你可以看到句子的哪个部分已经移动到一个新的位置以及内容是什么......我知道,我终于解决了它。但我不记得如何:(

如果每个单词在翻译后再次使用相同的位置,您可以先将空格或htmltag中的所有单词分成数组,并记住每个HTML标记的位置,并在翻译后重新应用...

答案 1 :(得分:-3)

将google翻译服务添加到您的网站,并添加不会翻译的说明。

https://translate.google.com/manager/