我正在寻找离线的开源翻译/ API。翻译一定不好,只是足以分析关键词。
我正在编写一个firefox插件。插件计算网站是垃圾的可能性。它像垃圾邮件过滤器一样,通过统计“邪恶”来实现。话。它适用于英语,但我是德语,德语对计算机来说更难。我的想法是简化'将语言翻译成英文并分析英文文本。有谷歌翻译API,但现在你必须付钱。我知道还有其他程序可以翻译网站:
https://stackoverflow.com/questions/6151668/alternative-to-google-translate-api
他们都有一个问题。您将网站的html代码发送到服务器,服务器为您翻译文本并将其发回。这会增加流量并减慢速度。服务器的所有者也不会喜欢你。
这就是为什么我要搜索离线的开源翻译器。翻译一定不好,只是足以分析关键词。只需使用字典并逐字翻译就无法工作。
示例:' Ich bringe Dich um'意思是“我杀了你”#39;如果你逐字翻译,你会得到:'我带你到你身边。'这种翻译听起来很奇怪,但不是邪恶的。问题是' bringe ...嗯'只是一个字。
我想避免德语因为这样的令人讨厌的问题(而且还有更多的问题:23个不同的复数规则等)。我认为发明自动翻译的程序员已经面临并解决了这些问题。
答案 0 :(得分:1)
Apache Joshua(Incubating)Home可能是您的解决方案。
只需下载所需的语言包,然后将其作为服务器运行即可。正如他们所说:
一个关键特性是没有依赖关系(除了Java 8)。 让机器翻译系统在您自己的机器上运行就像 轻松下载tarball,解压缩,然后运行 包含shell脚本。
您接下来要做的就是进行网页查询以获取翻译(localhost:5674/translate?meta=list_weights&q=cifra+inferior+a+lo+que+predec%C3%ADan+las+encuestas+%2C+que+pronosticaban+de+mas+del+60+%25+de+participaci%C3%B3n+electoral+.&q=yo+quiero+taco+bell
),您将获得带有翻译文本的回复作为JSON。
希望这有帮助!