图数据库中的序列

时间:2016-10-27 13:46:13

标签: database graph sequence graph-databases

所有

我是图形数据库领域的新手,想知道这种类型的示例是否适用于图形数据库。

说我在看棒球比赛。当每个玩家去击球时,有3种可能的结果:击球,三振或步行。

对于每个击球手和整个棒球赛季,我想弄清楚的是序列的数量。

例如,对于那些去过盘子n次的击球手,有多少人有特定的序列(例如,击中/步行/三振出或击中/击中/击中/击中),如果有,有多少人有相同的序列击球手重复按时间索引的相同序列。为了进一步解释,时间将允许我知道在赛季开始时,中期或后半段是否发生特定序列(例如,命中/步行/三振出或命中/命中/命中/命中)。

对于键值类型数据库,原始数据如下所示:

  Batter      Time        Game    Event       Bat
  -------     -----       ----    ---------   ---
  Charles     April       1       Hit         1
  Charles     April       1       strikeout   2
  Charles     April       1       Walk        3
  Doug        April       1       Walk        1
  Doug        April       1       Hit         2
  Doug        April       1       strikeout   3
  Charles     April       2       strikeout   1
  Charles     April       2       strikeout   2
  Doug        May         5       Hit         1
  Doug        May         5       Hit         2
  Doug        May         5       Hit         3
  Doug        May         5       Hit         4

因此,我的输出显示如下:

 Sequence                    Freq        Unique Batters  Time
 -----------------------     ----        --------------  ------
 hit                         5000        600             April
 walk/strikeout              3000        350             April
 strikeout/strikeout/hit     2000        175             April
 hit/hit/hit/hit/hit         1000        80              April
 hit                         6000        800             May
 walk/strikeout              3500        425             May
 strikeout/strikeout/hit     2750        225             May
 hit/hit/hit/hit/hit         1250        120             May
 .                           .           .               .
 .                           .           .               .
 .                           .           .               .
 .                           .           .               .

如果这对于图形数据库是可行的,它还会扩展吗?如果不是击球手的3个可能的结果,那么10,000,000击球手就有10,000个可能的结果呢?

更重要的是,10,000个独特的结果将在组合设置中排序(例如10,000 CHOOSE 2,10000 CHOOSE 3等)。

我的问题是,如果图形数据库合适,您会如何建议设置解决方案?

提前非常感谢。

0 个答案:

没有答案