我很好奇当Google向您显示由多个单词组成的单词的“您的意思”链接时,使用的编程术语或方法是什么?
例如,如果我输入“redflower.jpg”它就知道将其分解为红花 做这种操作有一个共同的范例吗? Lucene搜索会给你这个吗?
谢谢!
答案 0 :(得分:4)
如果google没有看到reflowers.jpg的大量匹配结果,那么它可能会尝试用多个单词剪切单词,直到找到大量匹配结果。
它也可能识别扩展名(.jpg),识别图像扩展名,然后尝试查找名称相似的图像。
如果我必须制作这样的算法,我会使用一个庞大的EXISTING数据库(字典或搜索引擎),然后尝试我在帖子开头所说的内容。
答案 1 :(得分:1)
也许他们可以看看其他人搜索redflowers.jpg时会做些什么?也许有很多人搜索“redflowers.jpg”,没有点击任何链接,然后搜索“红花”,发现一些值得点击的结果。
当然,他们必须考虑到查询类似(包含匹配的字符串),否则可能会出现一些奇怪的结果。