我收集了大量存储在MongoDB中的推文。推文看起来像这样:
"_id" : ObjectId("4c02c58de500fe1be1000005"),
"contributors" : null,
"text" : "Hello world",
"user" : {
"following" : null,
"followers_count" : 5,
"utc_offset" : null,
"location" : "",
"profile_text_color" : "000000",
"friends_count" : 11,
"profile_link_color" : "0000ff",
"verified" : false,
"protected" : false,
"url" : null,
"contributors_enabled" : false,
"created_at" : "Sun May 30 18:47:06 +0000 2010",
"geo_enabled" : false,
"profile_sidebar_border_color" : "87bc44",
"statuses_count" : 13,
"favourites_count" : 0,
"description" : "",
"notifications" : null,
"profile_background_tile" : false,
"lang" : "en",
"id" : 149978111,
"time_zone" : null,
"profile_sidebar_fill_color" : "e0ff92"
},
"geo" : null,
"coordinates" : null,
"in_reply_to_user_id" : 149183152,
"place" : null,
"created_at" : "Sun May 30 20:07:35 +0000 2010",
"source" : "web",
"in_reply_to_status_id" : {
"floatApprox" : 15061797850
},
"truncated" : false,
"favorited" : false,
"id" : {
"floatApprox" : 15061838001
例如,如果我想查找有关某些主题的推文,例如canon,那么我应该如何编写一个检查“文本”的查询并找到所有关于“canon”的推文?
答案 0 :(得分:1)
MongoDB没有直接的本机查询支持来搜索文本。有官方文档向您展示如何实现全文搜索的简单方法:
http://www.mongodb.org/display/DOCS/Full+Text+Search+in+Mongo
它涉及将文本拆分为单词,并将它们存储在您编制索引的数组中。这使您可以匹配数组的内容。如何拆分它们是你的选择。也许你只是对小写关键字做单词,小写和匹配。或许你需要自动完成,这样你就可以对每个单词或语音等进行变换。这些都是源于此。
它不像全文搜索引擎那样强大,旨在实现这一目标,但它确实有效。根据您使用的语言,某些框架具有搜索包。例如,我使用mongodb和django's nonrel project,并且有一个search app用于提供词干和不同的搜索工具。