所有
我是图形数据库领域的新手,想知道这种类型的示例是否适用于图形数据库。
说我在看棒球比赛。当每个玩家去击球时,有3种可能的结果:击球,三振或步行。
对于每个击球手和整个棒球赛季,我想弄清楚的是序列的数量。
例如,对于那些去过盘子n次的击球手,有多少人有特定的序列(例如,击中/步行/三振出或击中/击中/击中/击中),如果有,有多少人有相同的序列击球手重复按时间索引的相同序列。为了进一步解释,时间将允许我知道在赛季开始时,中期或后半段是否发生特定序列(例如,命中/步行/三振出或命中/命中/命中/命中)。
对于键值类型数据库,原始数据如下所示:
Batter Time Game Event Bat
------- ----- ---- --------- ---
Charles April 1 Hit 1
Charles April 1 strikeout 2
Charles April 1 Walk 3
Doug April 1 Walk 1
Doug April 1 Hit 2
Doug April 1 strikeout 3
Charles April 2 strikeout 1
Charles April 2 strikeout 2
Doug May 5 Hit 1
Doug May 5 Hit 2
Doug May 5 Hit 3
Doug May 5 Hit 4
因此,我的输出显示如下:
Sequence Freq Unique Batters Time
----------------------- ---- -------------- ------
hit 5000 600 April
walk/strikeout 3000 350 April
strikeout/strikeout/hit 2000 175 April
hit/hit/hit/hit/hit 1000 80 April
hit 6000 800 May
walk/strikeout 3500 425 May
strikeout/strikeout/hit 2750 225 May
hit/hit/hit/hit/hit 1250 120 May
. . . .
. . . .
. . . .
. . . .
如果这对于图形数据库是可行的,它还会扩展吗?如果不是击球手的3个可能的结果,那么10,000,000击球手就有10,000个可能的结果呢?
更重要的是,10,000个独特的结果将在组合设置中排序(例如10,000 CHOOSE 2,10000 CHOOSE 3等)。
我的问题是,如果图形数据库合适,您会如何建议设置解决方案?
提前非常感谢。