将1GB的文字翻译成英文

时间:2018-08-02 07:07:39

标签: google-translate language-translation machine-translation

我正在寻找适合我的用例的语言翻译API /解决方案。

我的用例如下:

  • 数据是1 GB的免费非结构化文本,主要以世界通用语言(法语,西班牙语,德语,俄语,韩语)书写。每个文本的语言都是已知的。
  • 我们可以假定文本在语法上是正确的,并且由完整的句子组成,但是包含一些不常见的词,例如化合物名称。
  • 文本必须翻译成英文。
  • 该解决方案必须比Google Translate便宜至少10倍,后者每1百万个字符收费20美元。
  • 我愿意为了成本效益而牺牲一些Google的质量。谷歌,雅虎,微软,Yandex,Online-Translator.com都足够好,只是太贵了。

我可以使用一台16 CPU的计算机,因此也可以选择离线翻译。

有什么建议吗?

1 个答案:

答案 0 :(得分:3)

对于您的数量,机器翻译的价格从每1M符号3美元到25美元不等(有些离群值,例如ModernMT,每1000个单词的价格为eu)。

MT Price Comparison

如果您想权衡一点质量,则可以选择我们称之为“最佳引擎”的引擎-性能最佳的引擎中前5%以内,但价格最低。

Optimal general-purpose MT engines

您可能会在our Machine Translation report from July 2018中找到更多详细信息。

然后,您需要知道哪些引擎支持您的语言对并处理其API,请求限制和配额。

您可以使用Intento API来get a list of engines for your language pairs。 然后,您可以在the async mode中使用此API,然后Intento会处理所有限制。但是我不确定它将处理1G文件,但是欢迎您尝试。

为避免修改API请求,建议您使用the CLI