从MongoDB驱动程序获取二进制字段

Getting a Binary Field from MongoDB Driver

本文关键字:二进制 字段 获取 驱动程序 MongoDB      更新时间:2023-09-26

如何从现有的 mongo db文档中获得二进制字段?

在MongoDB控制台,如果我为选择的记录做一个查找,我得到这个:

{_id:ObjectId("1234"),"cover_data" : BinData(2,"ozkAAP/Y/+AAEEpGSUYAAQEBAJYAlgAA/+IFpElDQ19QUk9GSUxFAAEBAAAFlGFwcGwCIAAAbW50clJHQiBYWVogB9kAAgAZAAsAGgALYWNzcEFQUEwAAAAAYXBwbAAAAAAAAAAAAAAAAAAAAAAAAPbWAAEAAAA ..... )

在我们的web服务器上的python中,当我们使用pymongo进行查找时,它会将该字段转换为二进制,json_pickle似乎会自动将其转换为base64,唉,当发送回客户端时,图像看起来很棒。当我比较生成的base64和node.js mongo驱动程序时,它是完全不同的,不能正确显示图像。

Node.JS的代码如下:

cb = function(comp) {
    thumb_buffer = new Buffer(comp.thumbnail_data.value(),'binary');
    comp.thumbnail_data = thumb_buffer.toString('base64');
}

在这里的示例和测试用例中:https://github.com/christkv/node-mongodb-native我没有看到我要做的任何示例。似乎有BSON反序列化器和用于整个BSON对象的BinaryParser。我只尝试了一个字段,得到了分割错误。

我尝试过的事情的运行列表:

    mongo_compositions.find {_id:{$in:ids}},{},(err,compositions) -> 
            for comp in compositions
                do(comp) =>
                    thumb_buffer = comp.thumbnail_data.value(true)
                    test_buffer = Binary(thumb_buffer)
                    console.log test_buffer
                    console.log test_buffer.toString('base64')
                    #thumb_buffer = BSON.deserialize thumb_buffer
                    #thumb_buffer.write(comp.thumbnail_data.value(true))
                    #comp.thumbnail_data = thumb_buffer.toString('base64')
                    #cover_buffer = new Buffer(comp.cover_data.value(),'binary')
                    #console.log thumb_buffer.toString('base64')
                    #console.log "#{comp.composition_author} - #{comp.thumbnail_data.length}"
                    #comp.cover_data = cover_buffer.toString('base64')

我对你想做的事情有点困惑。当使用node-mongodb选择/插入二进制元素到MongoDB时,必须使用二进制bson对象。

var buffer = new Buffer(); /* your binary data */
var binary = client.bson_serializer.Binary( buffer );
var myDoc = {
    binaryField: binary;
}
//And for when selecting the document
var buffer = myDoc.binaryField.value( true ); 

设置toString参数为true以选择它作为Buffer;False返回"二进制",但正如手册所说,应该避免对缓冲区对象使用。

将buffer转换为base64:

buffer.toString('base64');

结果是:myDoc.binaryField.value( true );前4个字节(32位)是数据大小的大端长度。如果你从这4个字节以外的缓冲区中读取,那么它将最终成为数据。

在我的例子中,数据的开头是这样的:

63 12 00 00 ff d8 ff e0 00 10 4a 46

python数据如下所示:

ff d8 ff e0 00 10 4a 46

Binary = client.bson_serializer.Binary
binary = new Binary(myDoc.binaryField.value( true ))
buffer = new Buffer(binary.toString(),'binary')
length_buf = buffer.slice(0,4)
length = length_buf[3] << 32 | length_buf[2] << 16 | length_buf[1] << 8 | length_buf[0]
buffer.slice(4).slice(0,length).toString(enc)