我是数据分配配件的新手
我浏览了一些网页,发现了一些有趣的R包,例如fitdistrplus
然而,对于新手而言似乎太复杂了
我有一个随机创建的示例数据:
dt <- data.table::fread("
Days `2014Count` `2015Count` `2016Count`
0 0 0 0
1 757 1590 711
2 1641 2430 2538
3 8719 10378 13944
4 13489 17745 23887
5 38064 52103 61749
6 14000 18413 24871
7 8148 10534 14384
8 9341 11609 15991
9 5946 6805 9400
9 5946 6805 9400
10 6881 8475 9889
11 4297 5091 6160
12 4732 6065 6101
13 3149 3990 4163
14 2336 3169 3648
15 1972 2547 3006
16 1472 1762 2126
17 1020 1380 1816
18 890 1079 1004
19 557 813 722")
如果我想检查哪个发行版可以适合我的数据,那么第一步是什么?
我尝试绘制Count
中的每一个,并且所有三个看起来都像lognormal
或gamma
,但似乎有大参数。
我不知道如何开始。是否有任何关于新秀学习的提法?
谢谢!