我有一个存储在mongodb数据库中的大型希腊推文数据库。
(3M Tweets提供30GB的存储空间)。
我在文本上创建了一个文本索引,在时间戳字段上创建了一个有序索引。但是,我发现MongoDB不支持希腊语进行文本索引,因此希腊语中的文本查询速度相对较慢。我如何面对这个问题并为希腊文件创建倒排索引?
答案 0 :(得分:0)
使用solr构建索引而不是mongodb,它具有很多支持多语言搜索的功能。
答案 1 :(得分:0)
我刚刚发现,如果根据文档选择无语言,则会创建使用标记化的简单反向索引。
http://docs.mongodb.org/manual/reference/text-search-languages/#text-search-languages
如果指定语言值“none”,则文本搜索使用 简单的标记化,没有停用词列表,也没有词干