这个问题不一定是Couchbase 2.0开发的具体预览,但我认为它可以帮助人们调查新的Couchbase产品。
我正在寻找有关数据建模的建议。我们正在调查Couchbase,以便将其用于实时分析。
但是我找不到任何关于如何最好地模拟现实世界数据的文档。
我将提出一个场景,如果社区可以帮助我或讨论如何建模的一些想法,那将非常有用吗?
请注意,这不代表我们的产品,我不是要求人们为我们解决我们的建模问题更倾向于讨论
让我们假设客户在特定日期/时间购买产品,产品有ID,名称,描述和价格等信息,并在日期进行购买。
最初的要求是能够计算两个日期之间的所有购买。对于任何1天,可能会有超过100,000次购买 - 这是一项非常大的业务;)
如果任何语法错误,请告知我们 - 欢迎提供所有建议/帮助。
如果我们对数据进行建模(可能完全不正确):
购买产品
{
"_id" : "purchase_1",
"_rev" : "1-1212afdd126126128ae",
"products" : [
"prod_1" : {
"name" : "Milk",
"desc" : "Semi-skimmed 1ltr",
"price" : "0.89"
},
"prod_7568" : {
"name" : "Crisps",
"desc" : "Salt and Vinegar",
"price: "0.85"
}
]
"date" : "2012-01-14 14:24:33"
}
{
"_id" : "purchase_2",
"_rev" : "1-1212afdd126126128ae",
"products" : [
"prod_89001" : {
"name" : "Bread",
"desc" : "White thick sliced",
"price: "1.20"
}
]
"date" : "2012-01-14 15:35:59"
}
因此,考虑到文档布局,我们可以看到每次购买,我们可以看到购买中的产品 - 但是我们怎样才能计算两个日期之间的所有购买?另外,你怎么能看到日期降序的两个日期之间所有购买的日志?
这是Couchbase适合的吗?
两个日期之间可能会有数十万次购买,而且客户不愿意等待报告...。我确信每个人都有经验;)
最好使用incr函数,如果是这样,您将如何建模数据?
非常感谢任何阅读此内容的人 - 我希望在可能的情况下进一步提供有关真实世界建模问题的更多示例。
詹姆斯
答案 0 :(得分:6)
在最简单的情况下,您可以编写一个Map函数,该函数将使用日期字段作为键创建视图。
因此略微修改了文档设计:
{
"_id": "purchase_1",
"_rev": "2-c09e24efaffd446c6ee8ed6a6e2b4a22",
"products": [
{
"id": "prod_3",
"name": "Bread",
"desc": "Whole wheat high fiber",
"price": 2.99
}
],
"date": "2012-01-15 12:34:56"
}
{
"_id": "purchase_2",
"_rev": "2-3a7f4e4e5907d2163d6684f97c45a715",
"products": [
{
"id": "prod_1",
"name": "Milk",
"desc": "Semi-skimmed 1ltr",
"price": 0.89
},
{
"id": "prod_7568",
"name": "Crisps",
"desc": "Salt and Vinegar",
"price": 0.85
}
],
"date": "2012-01-14 14:24:33"
}
您的地图功能如下:
function(doc) {
for (var product in doc.products) {
emit(doc.date, doc.products[product].price);
}
}
您可以选择添加一个reduce函数,该函数可以按日期汇总购买。
function(keys, values) {
return sum(values);
}
然后,您可以使用startkey和endkey参数查询视图。
http://localhost:5984/couchbase/_design/Products/_view/total_price_by_date?startkey="2012-01-01"&endkey="2012-01-31"&group=true
查询视图的输出将是:
{"rows":[
{"key":"2012-01-14 14:24:33","value":4.94},
{"key":"2012-01-15 12:34:56","value":2.99}
]}
或删除group参数以获取整个日期范围的总和:
{"rows":[
{"key":null,"value":7.930000000000001}
]}
希望有所帮助。
- 约翰