rmongodb:如何通过在投影查询中指定来强制执行字段排序?

时间:2016-06-18 01:57:59

标签: r mongodb aggregation-framework rmongodb

我正在尝试使用rmongodb包从mongodb检索到R中的一些数据。在某个时间点,存储文档中字段的顺序发生了变化。

我试图强制我的投影查询通过明确指定在SO question中尝试的方法来保持投影字段的顺序,如下所示:

data <- mongo.find.all(mongo_conn, table,
                          fields = list('id1' = 1, 'id2' = 2,
                                        'time' = 3, 'latitude' = 4,
                                        'longitude' = 5, '_id' = 0))

我似乎无法找到一个好的答案。它按照它们在DB中的顺序返回字段,并将其更改为课程列表。

这意味着,它对我必须编写什么样的循环代码以将返回的结果组织成数据框(如结构)造成了明显的破坏。

知道如何按指定的顺序获取字段而不是DB中的字段吗?

1 个答案:

答案 0 :(得分:1)

在链接到它的答案中说

  

简单的回答是你不能这样做。

另见related mongodb ticket

但是,为了让您的结果符合类似data.frame的结构,请使用mongolite,这样可以更轻松地使用

使用 mtcars 数据

考虑此示例
data("mtcars")

library(mongolite)  

mongo <- mongo(db = "test",
               collection = "mtcars",
               url = "mongodb://localhost")

## insert into database
mongo$insert(mtcars)
# Complete! Processed total of 32 rows.
# [1] TRUE

mongolite::find会自动将查询结果简化为data.frame结构

df_results <- mongo$find()
# Imported 32 records. Simplifying into dataframe...

head(df_results)
#                     mpg cyl disp  hp drat    wt  qsec vs am gear carb
# Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
# Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
# Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
# Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
# Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
# Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

或者,使用聚合框架

mongo$aggregate(pipeline = '[{ "$project" : { "mpg" : 1, "wt" : 1, "_id" : 0}  },
                             { "$limit" : 5 }]')

# Imported 5 records. Simplifying into dataframe...
#     mpg    wt
# 1 21.0 2.620
# 2 21.0 2.875
# 3 22.8 2.320
# 4 21.4 3.215
# 5 18.7 3.440

现在进行一些无耻的自我推销。我一直致力于对mongolite的扩展,它返回一个data.table对象。 这里的想法是提高返回对象的速度,但前提是可以使用rbindlist强制返回结果集。

软件包是mongolitedt,目前仍在开发中。

# devtools::install_github("SymbolixAU/mongolitedt")
library(mongolitedt)

bind_mongolitedt(mongo)

mongo$aggregatedt(pipeline = '[{ "$project" : { "mpg" : 1, "wt" : 1, "_id" : 0}  },
                             { "$limit" : 5 }]')

## now have a data.table object returned
#  Imported 5 records.
#     mpg    wt
# 1: 21.0 2.620
# 2: 21.0 2.875
# 3: 22.8 2.320
# 4: 21.4 3.215
# 5: 18.7 3.440

## clean up
rm(mongo); gc()