我正在尝试使用rmongodb
包从mongodb检索到R中的一些数据。在某个时间点,存储文档中字段的顺序发生了变化。
我试图强制我的投影查询通过明确指定在SO question中尝试的方法来保持投影字段的顺序,如下所示:
data <- mongo.find.all(mongo_conn, table,
fields = list('id1' = 1, 'id2' = 2,
'time' = 3, 'latitude' = 4,
'longitude' = 5, '_id' = 0))
我似乎无法找到一个好的答案。它按照它们在DB中的顺序返回字段,并将其更改为课程列表。
这意味着,它对我必须编写什么样的循环代码以将返回的结果组织成数据框(如结构)造成了明显的破坏。
知道如何按指定的顺序获取字段而不是DB中的字段吗?
答案 0 :(得分:1)
在链接到它的答案中说
简单的回答是你不能这样做。
但是,为了让您的结果符合类似data.frame
的结构,请使用mongolite
,这样可以更轻松地使用
使用 mtcars 数据
考虑此示例data("mtcars")
library(mongolite)
mongo <- mongo(db = "test",
collection = "mtcars",
url = "mongodb://localhost")
## insert into database
mongo$insert(mtcars)
# Complete! Processed total of 32 rows.
# [1] TRUE
mongolite::find
会自动将查询结果简化为data.frame结构
df_results <- mongo$find()
# Imported 32 records. Simplifying into dataframe...
head(df_results)
# mpg cyl disp hp drat wt qsec vs am gear carb
# Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
# Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
# Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
# Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
# Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
# Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
或者,使用聚合框架
mongo$aggregate(pipeline = '[{ "$project" : { "mpg" : 1, "wt" : 1, "_id" : 0} },
{ "$limit" : 5 }]')
# Imported 5 records. Simplifying into dataframe...
# mpg wt
# 1 21.0 2.620
# 2 21.0 2.875
# 3 22.8 2.320
# 4 21.4 3.215
# 5 18.7 3.440
现在进行一些无耻的自我推销。我一直致力于对mongolite的扩展,它返回一个data.table对象。
这里的想法是提高返回对象的速度,但前提是可以使用rbindlist
强制返回结果集。
软件包是mongolitedt
,目前仍在开发中。
# devtools::install_github("SymbolixAU/mongolitedt")
library(mongolitedt)
bind_mongolitedt(mongo)
mongo$aggregatedt(pipeline = '[{ "$project" : { "mpg" : 1, "wt" : 1, "_id" : 0} },
{ "$limit" : 5 }]')
## now have a data.table object returned
# Imported 5 records.
# mpg wt
# 1: 21.0 2.620
# 2: 21.0 2.875
# 3: 22.8 2.320
# 4: 21.4 3.215
# 5: 18.7 3.440
## clean up
rm(mongo); gc()