创建单词词典并映射到其他语言

时间:2018-12-16 10:26:30

标签: nlp stanford-nlp google-translate google-translator-toolkit

我正在创建一个应用程序,用户可以在其中搜索多种语言。假设我有一个网站,其中刊登了一部非常大的小说。可能包含成千上万个段图。有些在20,000至30,000个段图之间。

用户可以阅读多种语言的小说。他可以使用多种语言进行搜索。例如,他用英语搜索“ LOVE”,我将向他显示所有包含“ LOVE”的段落。

现在,如果用户切换到法语,并搜索“爱”(法语),我将向他显示所有包含“爱”的段落。

我可以通过创建小说的两个版本来做到这一点,一个是法语版本,另一个是英语版本。确实,我将提供翻译。但是,当用户阅读小说时,我会给他一个选择,可以单击任何单词,然后查看其翻译成其他语言的情况。在这种情况下,如果他正在阅读英语,我将向他展示该特定单词的法语翻译,反之亦然。

这意味着我想保持不同语言之间的词对词映射。

一种方法是创建自己的地图,这是很多工作。另一种方法是一些API调用,例如Google Translator。 您能建议最好的方法吗?任何现有的API? 一些Google条款可以为该任务指明正确的方向,也会有所帮助。

1 个答案:

答案 0 :(得分:1)

Elasticsearch可以很好地解决您的问题。

  1. 只需用其本国语言对您的内容编制索引(将其编入索引)
  2. 然后,您可以使用Elasticsearch语音插件进行多语言搜索(https://www.elastic.co/guide/en/elasticsearch/plugins/current/analysis-phonetic.html

对于另一部分,您想逐字进行翻译,我认为可以集成Google翻译或其他翻译api,也可以集成elasticsearch。

我希望这会有所帮助。