我正在搜索服务器端应用程序(不是服务,我们需要自己托管),它可以获取给定的字符串并将其翻译成另一种语言。开源,付费,没关系。
任何人都可以提供一些建议吗?
答案 0 :(得分:2)
开源翻译包
以下是一些最先进的开源机器翻译包:
培训数据
要使用上述每个包,您需要培训数据。如果您在许多欧洲语言之间进行翻译,您可以使用Phillip Koehn的Europarl parallel corpus。如果您对Europarl平行语料库中没有的欧盟(EU)语言感兴趣,可以通过抓取proceedings of the European parliament来收集数据。所有欧盟程序都被翻译成每种欧盟语言,并在网上免费提供,这使它们成为机器翻译培训数据的良好来源。
您可以从Linguistics Data Consortium (LDC)目录中获取非欧洲语言的培训数据(例如Chinese-to-English)。