如何在RavenDB中有效地检查文档的存在

时间:2012-04-26 16:57:47

标签: database database-design nosql data-modeling ravendb

我有一个域实体Contacts,Contact通过MemberOf属性与列表相关联(包含RavenDB中的列表ID)

public class Contact
{
    public string Id { get; set; }
    public string Email { get; set; }
    public string Name { get; set; }
    public string Country { get; set; }
    public List<string> MemberOf { get; set; }
}

我想使用 RavenDB 来存储联系人,其中一种上传联系人的方法是通过CSV文件(批量)。我在想如何在两个CSV文件具有相同的联系人时防止重复数据,我认为当他们拥有相同的电子邮件时,联系人是相同的 - 这与我的域逻辑有关。联系人可以是两个不同的CSV列表的成员,例如
我上传了两个具有相同电子邮件地址字段的CSV列表,问题是我希望联系人类将MemeberOf设置为有两个列表,这样可以避免每个列表都有重复的条目,因为我的应用程序的域逻辑需要每个电子邮件一个联系对象进行统计分析。

请挑战我的设计,我可能没有最好的数据模型。

谢谢

1 个答案:

答案 0 :(得分:4)

RavenDB为您强制执行的唯一唯一约束是文档ID。因此,您可以使用的一种方法是将电子邮件地址设为doc Id。然后,您可以编写如下代码:

using (var session = docStore.OpenSession())
{
    foreach (var csvItemToImport in csvfile)
    {
        var existingDoc = session.Load<Contact>(csvItemToImport.Email);    
        if (existingDoc == null)
        {
            //No doc with the given email exists, add a new one
            session.Store(new Contact{ ... });
        }
        else
        {
            existingDoc.MemberOf.Add(csvItemToImport.ListName)
            // No need to store the doc, it's tracked in the session automatically
        }     
    }
    //Save the changes so far back to the dBase, in a single batched transaction
    session.SaveChanges();
}

由于文档ID是网址(/docs/contacts/blah@blah.co.uk),因此您可能需要进行一些转义以解释电子邮件地址中的“@”。

你的POCO将如下所示:

public class Contact
{
    public string Id { get; set; } //this is actually an email address 
    public string Name { get; set; }
    public string Country { get; set; }
    public List<string> MemberOf { get; set; }
}
如果您不希望文档ID为电子邮件地址(无论出于何种原因),请

更新。您可以使用方法outlined here。它每次只存储2个文档,Contact doc和另一个确保唯一约束的文档。