Node.js / MongoDB / Mongoose:缓冲区比较

时间:2013-09-10 16:12:05

标签: javascript node.js mongodb mongoose buffer

首先,一点背景:

我正在尝试检查图像的二进制数据是否已经保存在Mongo中。给出以下架构:

var mongoose = require('mongoose')
  , Schema = mongoose.Schema;

var imageSchema = new Schema({
    mime:  String,
    bin: { type: Buffer, index: { unique: true }},
    uses : [{type: Schema.Types.ObjectId}]
});

module.exports = mongoose.model('Image', imageSchema);

...我想查询图像是否存在,是否添加了我的对象正在使用它的引用,然后更新它。如果没有,我想创建(upsert)它。

鉴于它不存在的情况,下面的代码完美地运行。如果是,则以下代码不会,并将另一个Image文档添加到Mongo。我觉得它可能是Mongo Buffer类型与节点缓冲区的比较问题,但我无法弄清楚如何正确地比较它们。请让我知道如何更新以下内容!谢谢!

Image.findOneAndUpdate({
    mime : contentType,
    bin : image
}, {
    $pushAll : {
        uses : [ myObject._id ]
    }
}, {
    upsert : true
}, function(err, image) {
    if (err)
        console.log(err);
    // !!!image is created always, never updated!!!
});

3 个答案:

答案 0 :(得分:6)

Mongoose将目标存储的缓冲区元素转换为mongodb Binary,但在执行查询时会执行相应的强制转换。 在units tests中也检查了预期的行为(也是node.js缓冲区的存储和检索)。

您确定要传递node.js缓冲区吗?

在任何情况下,我认为处理初始问题的最佳方法(检查图像是否已经在数据库中)将存储二进制数据的强哈希摘要(sha1,sha256,...)并检查(使用加密模块)。 在查询时,作为初步测试,您还可以检查二进制长度以避免不必要的计算。

有关如何在存储/查询图像之前获取图像摘要的示例:

var crypto = require('crypto');

...

// be sure image is a node.js Buffer
var image_digest = crypto.createHash('sha256');
image_digest.update(image);
image_digest = image_digest.digest('base64');

答案 1 :(得分:0)

通过node.js查询包含图像数据的缓冲区来查询图像不是一个好主意。你是对的,它可能是BSON二进制数据类型和节点Buffer之间的问题,但你的应用程序真的需要这样的比较吗?

相反,我会在您的架构中添加一个imageID或slug字段,为此字段添加索引,并在bin调用中对其进行查询而不是findOneAndUpdate

var imageSchema = new Schema({
    imageID: { type: String, index: { unique: true }},
    mime:  String,
    bin: Buffer,
    uses : [{type: Schema.Types.ObjectId}]
});

答案 2 :(得分:0)

散列确实有效,我使用的另一个过滤器是图像的exif数据。 由于这是结构化信息,如果您在exif数据上匹配,则可以进入下一步检查哈希值或文件大小的匹配...

大量的节点模块,以便为您的存储轻松获取exif数据:) 获取节点的exif数据的示例代码