我有一个博客系统,可以将上传的文件存储到GridFS系统中。问题是,我不明白如何查询它!
我正在使用Mongoose和NodeJS,它还不支持GridFS,所以我使用实际的mongodb模块进行GridFS操作。没有SEEM可以像查询常规集合中的文档那样查询文件元数据。
将元数据存储在指向GridFS objectId的文档中是否明智?能够轻松查询?
任何帮助都会非常感激,我有点卡住:/
答案 0 :(得分:18)
GridFS通过为每个文件存储多个块来工作。这样,您可以传送和存储非常大的文件,而无需将整个文件存储在RAM中。此外,这使您可以存储大于最大文档大小的文件。建议的块大小为256kb。
文件元数据字段可用于存储其他特定于文件的元数据,这比将元数据存储在单独的文档中更有效。这在很大程度上取决于您的确切要求,但通常,元数据字段提供了很大的灵活性。请记住,默认情况下,一些更明显的元数据已经是fs.files
文档的一部分:
> db.fs.files.findOne();
{
"_id" : ObjectId("4f9d4172b2ceac15506445e1"),
"filename" : "2e117dc7f5ba434c90be29c767426c29",
"length" : 486912,
"chunkSize" : 262144,
"uploadDate" : ISODate("2011-10-18T09:05:54.851Z"),
"md5" : "4f31970165766913fdece5417f7fa4a8",
"contentType" : "application/pdf"
}
要从GridFS实际读取文件,您必须从fs.files
和fs.chunks
的块中获取文件文档。最有效的方法是将其流式传输到客户端块,因此您不必将整个文件加载到RAM中。 chunks
集合具有以下结构:
> db.fs.chunks.findOne({}, {"data" :0});
{
"_id" : ObjectId("4e9d4172b2ceac15506445e1"),
"files_id" : ObjectId("4f9d4172b2ceac15506445e1"),
"n" : 0, // this is the 0th chunk of the file
"data" : /* loads of data */
}
如果您想使用metadata
fs.files
字段进行查询,请务必了解dot notation,例如
> db.fs.files.find({"metadata.OwnerId": new ObjectId("..."),
"metadata.ImageWidth" : 280});
还要确保您的查询可以使用explain()
的索引。
答案 1 :(得分:6)
正如specification所说,您可以在元数据字段中存储您想要的任何内容。
以下是文件集合中的文档的样子:
必填字段
{
"_id" : <unspecified>, // unique ID for this file
"length" : data_number, // size of the file in bytes
"chunkSize" : data_number, // size of each of the chunks. Default is 256k
"uploadDate" : data_date, // date when object first stored
"md5" : data_string // result of running the "filemd5" command on this file's chunks
}
可选字段
{
"filename" : data_string, // human name for the file
"contentType" : data_string, // valid mime type for the object
"aliases" : data_array of data_string, // optional array of alias strings
"metadata" : data_object, // anything the user wants to store
}
因此,将您想要的任何内容存储在元数据中,并像在MongoDB中一样查询它:
db.fs.files.find({"metadata.some_info" : "sample"});
答案 2 :(得分:2)
我知道这个问题没有询问Java查询元数据的方式,但是在这里,假设你将gender
添加为元数据字段:
// Get your database's GridFS
GridFS gfs = new GridFS("myDatabase);
// Write out your JSON query within JSON.parse() and cast it as a DBObject
DBObject dbObject = (DBObject) JSON.parse("{metadata: {gender: 'Male'}}");
// Querying action (find)
List<GridFSDBFile> gridFSDBFiles = gfs.find(dbObject);
// Loop through the results
for (GridFSDBFile gridFSDBFile : gridFSDBFiles) {
System.out.println(gridFSDBFile.getFilename());
}
答案 3 :(得分:0)
元数据存储在元数据字段中。您可以像
一样查询db.fs.files.find({metadata: {content_type: 'text/html'}})