查询MongoDB GridFS?

时间:2011-12-15 07:33:18

标签: mongodb node.js mongoose gridfs

我有一个博客系统,可以将上传的文件存储到GridFS系统中。问题是,我不明白如何查询它!

我正在使用Mongoose和NodeJS,它还不支持GridFS,所以我使用实际的mongodb模块进行GridFS操作。没有SEEM可以像查询常规集合中的文档那样查询文件元数据。

将元数据存储在指向GridFS objectId的文档中是否明智?能够轻松查询?

任何帮助都会非常感激,我有点卡住:/

4 个答案:

答案 0 :(得分:18)

GridFS通过为每个文件存储多个块来工作。这样,您可以传送和存储非常大的文件,而无需将整个文件存储在RAM中。此外,这使您可以存储大于最大文档大小的文件。建议的块大小为256kb。

文件元数据字段可用于存储其他特定于文件的元数据,这比将元数据存储在单独的文档中更有效。这在很大程度上取决于您的确切要求,但通常,元数据字段提供了很大的灵活性。请记住,默认情况下,一些更明显的元数据已经是fs.files文档的一部分:

> db.fs.files.findOne();
{
    "_id" : ObjectId("4f9d4172b2ceac15506445e1"),
    "filename" : "2e117dc7f5ba434c90be29c767426c29",
    "length" : 486912,
    "chunkSize" : 262144,
    "uploadDate" : ISODate("2011-10-18T09:05:54.851Z"),
    "md5" : "4f31970165766913fdece5417f7fa4a8",
    "contentType" : "application/pdf"
}

要从GridFS实际读取文件,您必须从fs.filesfs.chunks的块中获取文件文档。最有效的方法是将其流式传输到客户端块,因此您不必将整个文件加载到RAM中。 chunks集合具有以下结构:

> db.fs.chunks.findOne({}, {"data" :0});
{
    "_id" : ObjectId("4e9d4172b2ceac15506445e1"),
    "files_id" : ObjectId("4f9d4172b2ceac15506445e1"),
    "n" : 0, // this is the 0th chunk of the file
    "data" : /* loads of data */
}

如果您想使用metadata fs.files字段进行查询,请务必了解dot notation,例如

> db.fs.files.find({"metadata.OwnerId": new ObjectId("..."), 
                    "metadata.ImageWidth" : 280});

还要确保您的查询可以使用explain()的索引。

答案 1 :(得分:6)

正如specification所说,您可以在元数据字段中存储您想要的任何内容。

以下是文件集合中的文档的样子:

必填字段

{
  "_id" : <unspecified>,                  // unique ID for this file
  "length" : data_number,                 // size of the file in bytes
  "chunkSize" : data_number,              // size of each of the chunks.  Default is 256k
  "uploadDate" : data_date,               // date when object first stored
  "md5" : data_string                     // result of running the "filemd5" command on this file's chunks
}

可选字段

{    
  "filename" : data_string,               // human name for the file
  "contentType" : data_string,            // valid mime type for the object
  "aliases" : data_array of data_string,  // optional array of alias strings
  "metadata" : data_object,               // anything the user wants to store
}

因此,将您想要的任何内容存储在元数据中,并像在MongoDB中一样查询它:

db.fs.files.find({"metadata.some_info" : "sample"});

答案 2 :(得分:2)

我知道这个问题没有询问Java查询元数据的方式,但是在这里,假设你将gender添加为元数据字段:

// Get your database's GridFS
GridFS gfs = new GridFS("myDatabase);

// Write out your JSON query within JSON.parse() and cast it as a DBObject
DBObject dbObject = (DBObject) JSON.parse("{metadata: {gender: 'Male'}}");

// Querying action (find)
List<GridFSDBFile> gridFSDBFiles = gfs.find(dbObject);

// Loop through the results
for (GridFSDBFile gridFSDBFile : gridFSDBFiles) {
    System.out.println(gridFSDBFile.getFilename());
}

答案 3 :(得分:0)

元数据存储在元数据字段中。您可以像

一样查询
db.fs.files.find({metadata: {content_type: 'text/html'}})