从MongoDB驱动程序获取二进制字段

时间:2011-11-07 23:47:17

标签: javascript mongodb node.js

如何从现有 mongo db文档中获取二进制字段?

在MongoDB控制台上,如果我找到选择的记录,我会得到这个:

{_id:ObjectId("1234"),"cover_data" : BinData(2,"ozkAAP/Y/+AAEEpGSUYAAQEBAJYAlgAA/+IFpElDQ19QUk9GSUxFAAEBAAAFlGFwcGwCIAAAbW50clJHQiBYWVogB9kAAgAZAAsAGgALYWNzcEFQUEwAAAAAYXBwbAAAAAAAAAAAAAAAAAAAAAAAAPbWAAEAAAA ..... )

在我们的Web服务器上的python中,当我们使用pymongo进行查找时,它将该字段作为二进制文件并且json_pickle似乎自动将其转换为base64,并且当发送回客户端时图像看起来很棒。当我将生成的base64与node.js mongo驱动程序进行比较时,它完全不同,并且无法正确显示图像。

以下是Node.JS的代码:

cb = function(comp) {
    thumb_buffer = new Buffer(comp.thumbnail_data.value(),'binary');
    comp.thumbnail_data = thumb_buffer.toString('base64');
}

在这里的示例和测试用例中:https://github.com/christkv/node-mongodb-native我没有看到任何我想要做的例子。似乎有BSON反序列化器和BinaryParser,它用于整个BSON对象的情况。我只针对一个字段尝试了它并且出现了分段错误。

运行我尝试过的事情清单:

    mongo_compositions.find {_id:{$in:ids}},{},(err,compositions) -> 
            for comp in compositions
                do(comp) =>
                    thumb_buffer = comp.thumbnail_data.value(true)
                    test_buffer = Binary(thumb_buffer)
                    console.log test_buffer
                    console.log test_buffer.toString('base64')
                    #thumb_buffer = BSON.deserialize thumb_buffer
                    #thumb_buffer.write(comp.thumbnail_data.value(true))
                    #comp.thumbnail_data = thumb_buffer.toString('base64')
                    #cover_buffer = new Buffer(comp.cover_data.value(),'binary')
                    #console.log thumb_buffer.toString('base64')
                    #console.log "#{comp.composition_author} - #{comp.thumbnail_data.length}"
                    #comp.cover_data = cover_buffer.toString('base64')

2 个答案:

答案 0 :(得分:4)

我对你要做的事感到有点困惑。使用node-mongodb选择/插入二进制元素到MongoDB时,必须使用binary bson object.

var buffer = new Buffer(); /* your binary data */
var binary = client.bson_serializer.Binary( buffer );
var myDoc = {
    binaryField: binary;
}
//And for when selecting the document
var buffer = myDoc.binaryField.value( true ); 

将toString参数设置为true以将其选为Buffer; false返回为“binary”,但作为manual says,应该避免对缓冲区对象。

要从缓冲区转换为base64:

buffer.toString('base64');

答案 1 :(得分:2)

事实证明:myDoc.binaryField.value( true );前4个字节(32位)是数据大小的大端长度。如果你从过去那4个字节读取缓冲区,那么最终将成为数据。

在我的情况下,数据的开头看起来像是十六进制:

63 12 00 00 ff d8 ff e0 00 10 4a 46

python数据看起来像这样:

ff d8 ff e0 00 10 4a 46

Binary = client.bson_serializer.Binary
binary = new Binary(myDoc.binaryField.value( true ))
buffer = new Buffer(binary.toString(),'binary')
length_buf = buffer.slice(0,4)
length = length_buf[3] << 32 | length_buf[2] << 16 | length_buf[1] << 8 | length_buf[0]
buffer.slice(4).slice(0,length).toString(enc)