假设我们用非拉丁字母 - Arabic, Hebrew, Chinese, Japanese
等语言编写了名称。
search engine
如何匹配同名的original name
和English spelling
之间的匹配。反之亦然?
类似于日语中的拓海
名称和English
拼写Takumi
。
algorithm/technique
用来做这件事的是什么?
答案 0 :(得分:2)
美好的一天。
你必须做以下事情:
使用相同的符号对世界上的每个语言进行分类:
all langs:
最后,您将在任何lang中拼写任何符号之间有规则。 一些langs,例如印地语,中文等不会有任何规则。你应该创建自己的规则(基于这个langs的转录)。
algo:
[w] [e] [п] = wep
e e r
e - eng r - rus 转录[п] = p
答案 1 :(得分:0)
搜索引擎(如谷歌)可能拥有大量的数据集(语料库),每种语料库都有不同的语言。
当您想要将一种语言的单词翻译成其他语言时,可以通过使用第一语言搜索语料库中的单词,并在第二语言的语料库中返回兼容单词来完成。 (名称相同的技术)
这是基本的想法。
您最好在这里阅读有关NLP字段的背景信息: http://en.wikipedia.org/wiki/Natural_language_processing