基于 MongoDB 中另一个集合中的数据查询一个集合中的数据

Query data in one collection based on data in another collection in MongoDB

本文关键字:集合 一个 数据 数据查询 MongoDB 另一个 基于      更新时间:2023-09-26

我正在尝试学习如何使用MongoDB,并且非常困惑如何做到这一点。我有两个集合,一个有许多用户,另一个集合有许多项目。例如:

用户:

{
    "_id" : ObjectId("56dba03438e1a255b97e82b6"),
    "name" : "john",
    "age" : 25
}

项目:

{
    "_id" : ObjectId("56dba0db38e1a255b97e82b7"),
    "name" : "pencil"
}

现在,我想在我的应用程序中做的是允许用户选择一个项目,但多个用户可以选择同一个项目。所以我需要跟踪哪些用户点击了哪些项目。我想过使用另一个跟踪用户 ID 和项目 ID 的集合来执行此操作(用户只能选择一次项目)。这是正确的方法吗?我创建了这个集合:

用户项:

{ 
    "_id" : ObjectId("56dba0db38e1a255b97e82b7"),
    "userid" : "56db9fb038e1a255b97e82b5",
    "itemid" : "56dba03438e1a255b97e82b6"
}

如果这是正确的方法,那么我希望能够单击我的应用程序中的某个项目,并使其显示选择该项目的所有用户的列表。我该怎么做?我甚至只显示用户项目集合文档,其中在应用程序上选择了 itemid = itemid......但是现在如何根据用户项目集合中的用户显示用户集合中的所有用户?

router.get('/userlist/:id', function(req, res) {  
    var db = req.db;  
    var collection = db.get('useritems');  
    collection.find({'itemid' : '_id'},{},function(e,docs){  
       res.json(docs);     
    });  
});  

感谢您的帮助,我真的很难理解这将如何工作。

创建第三个集合的想法是一种解决方案,它反映了如何在关系数据库中解决此问题。使用MongoDB,根据您访问数据的方式考虑不同的模式通常是值得的。

在您的情况下,我不会创建另一个集合,而是跟踪哪个用户在用户文档、项目文档中或两个文档中选择了哪个项目。执行此操作的方式取决于数据访问模式。

将选定项目添加到用户文档

{
    "_id": ObjectId("56dba03438e1a255b97e82b6"),
    "name": "john",
    "age": 25,
    "selectedItemId": "56dba0db38e1a255b97e82b7"
}

如果您经常希望查看每个用户选择的项目,则将该项目存储在用户文档中是有意义的。检索用户时,只需对 items 集合执行一次额外调用即可检索该用户的项。(如果您决定使用 Mongoose 作为对象文档映射器 (ODM),则可以使用 Mongoose 的 populate 方法实现此额外调用)。

将用户添加到条目文档

{
    "_id": ObjectId("56dba03438e1a255b97e82b7"),
    "name": "pencil",
    "selectedBy": [
        "56dba0db38e1a255b97e82b4",
        "56dba0db38e1a255b97e82b5",
        "56dba0db38e1a255b97e82b6"
    ],
}

如果您经常希望查看哪些用户选择了给定项目,则在项目文档中存储一组用户是有意义的。检索项目时,您将拥有选择该项目的用户的 ID,然后可以从数据库中检索这些 ID。(同样,如果您决定使用猫鼬,则可以使用其populate方法执行此操作)。

添加两个解决方案

您更喜欢一种解决方案而不是另一种解决方案的原因是,鉴于您的访问模式,您将免于循环访问整个集合以获取所需的数据。例如,如果将用户数组添加到某个项目,如果要查找给定用户选择的项目,则必须遍历所有项目并查找用户 ID 数组,直到找到所需的用户。如果您仅将项目 ID 存储在用户文档中,并且突然需要查看给定项目的所有用户,则会发生类似情况。如果这两个调用都经常进行,那么在两个地方都有数据是值得的。事实上,这会"非规范化"您的数据,您必须确保在插入、更新和删除数据时,您会在两个地方都这样做,但如果您经常进行这两种类型的查询,这是一个更具可扩展性的解决方案。

将整个项目文档嵌入到用户文档中

{
    "_id": ObjectId("56dba03438e1a255b97e82b6"),
    "name": "john",
    "age": 25,
    "selectedItem": {
        "name": "pencil"             
    }
}

在OP的评论之后,我也将解决这种情况。这也是一种可能的解决方案,在简化访问数据所需的查询方面非常有用。只需查询用户文档,您就可以访问他/她选择的项目,而无需对项目集合进行额外查询。这种方法的局限性在于,如果出于某种原因要将项目的名称从 "pencil" 更新为 "Pencil" ,则必须确保在所有用户文档中更新它,否则您的数据将不一致。当您的嵌入文档更复杂时,这会变得更加复杂。尽管如此,它是一种广泛使用的解决方案。如果您很少更新数据,但经常读取数据,特别是如果您更有兴趣查看给定用户选择的项目,那么它肯定会加快您最常用的数据访问模式。

你是对的,只有你需要填充用户 id 来获取该集合的所有属性。我建议你使用(如果你不是)猫鼬

与猫鼬:

UserItems
  .find({'itemid' : '_id'})
  .populate('userid')
  .then( useritems => {
     // here you have all users with their data for a specific item
     return res.json(useritems);
  });

您可以在项目文档中添加一个数组,用于跟踪单击该项目的用户的 ID。这是假设 ID 存储在活动会话中。

docs.user_who_clicked.push(req.user._id);docs.save()

除非您有充分的理由,否则我不会为此创建一个单独的集合。 只需将 selectedBy 添加到每个 Item 文档即可。 此外,我发现只使用我自己唯一的名称或 ID 比使用内部 Mongo ID 查找内容更简单。 像这样:

var items = db.collection('items');                                                                                                                
items.updateOne({itemname:'nuts'},{$push:{selectedBy:'johns'}});                                                                                   
//...                                                                                                                                              
items.find({itemname:'nuts'}).toArray(function(err,items) {                                                                                        
  console.log(items[0].selectedBy);                                                                                                                
  db.close();
});