Node.js / MongoDB / Mongoose:缓冲区比较

Node.js / MongoDB / Mongoose: Buffer Comparison

本文关键字:缓冲区 比较 MongoDB js Node Mongoose      更新时间:2023-09-26

首先,一点背景:

我正在尝试检查图像的二进制数据是否已保存在Mongo中。 给定以下架构:

var mongoose = require('mongoose')
  , Schema = mongoose.Schema;
var imageSchema = new Schema({
    mime:  String,
    bin: { type: Buffer, index: { unique: true }},
    uses : [{type: Schema.Types.ObjectId}]
});
module.exports = mongoose.model('Image', imageSchema);

。我想查询图像是否存在,它是否确实添加了我的对象正在使用它的引用,然后更新它。 如果没有,我想创建(更新)它。

鉴于它不存在,下面的代码可以完美运行。 如果是这样,下面的代码不会,并将另一个图像文档添加到 Mongo。 我觉得这可能是Mongo缓冲区类型与节点缓冲区的比较问题,但是我不知道如何正确比较它们。 请让我知道如何更新以下内容! 谢谢!

Image.findOneAndUpdate({
    mime : contentType,
    bin : image
}, {
    $pushAll : {
        uses : [ myObject._id ]
    }
}, {
    upsert : true
}, function(err, image) {
    if (err)
        console.log(err);
    // !!!image is created always, never updated!!!
});

Mongoose 将要存储的缓冲区元素转换为 mongodb 二进制,但它在执行查询时执行适当的强制转换。在单元测试(也是节点的存储和检索.js缓冲区)中也会检查预期的行为。

您确定要传递节点.js缓冲区吗?

无论如何,我认为处理初始问题(检查图像是否已在数据库中)的最佳方法是存储二进制数据的强哈希摘要(sha1,sha256,...)并检查(使用加密模块)。查询时,作为初步测试,您还可以检查二进制长度以避免不必要的计算。

有关如何在存储/查询图像之前获取图像摘要的示例:

var crypto = require('crypto');
...
// be sure image is a node.js Buffer
var image_digest = crypto.createHash('sha256');
image_digest.update(image);
image_digest = image_digest.digest('base64');

按节点查询图像不是一个好主意.js 包含图像数据的缓冲区。您说得对,这可能是 BSON 二进制数据类型和节点缓冲区之间的问题,但您的应用程序真的需要这样的比较吗?

相反,我会将 imageID 或 slug 字段添加到您的架构中,向该字段添加索引,并对其进行查询,而不是在您的findOneAndUpdate调用中bin

var imageSchema = new Schema({
    imageID: { type: String, index: { unique: true }},
    mime:  String,
    bin: Buffer,
    uses : [{type: Schema.Types.ObjectId}]
});
哈希

确实有效,我使用的另一个过滤器是图像的exif数据。由于这是结构化信息,如果您在 exif 数据上匹配,则可以转到下一步,检查哈希或文件大小是否匹配......

成堆的节点模块,为您的存储:)轻松获取 EXIF 数据获取节点的 EXIF 数据的示例代码