我在csv中有一个序列(整数)的随机列表以及日期,例如:
1/1/2019,34 44 57 62 70
12/28/2018,09 10 25 37 38
12/25/2018,02 08 42 43 50
12/21/2018,10 13 61 62 70
12/18/2018,13 22 32 60 69
12/14/2018,05 22 26 43 49
12/11/2018,04 38 39 54 59
12/7/2018,04 10 20 33 57
12/4/2018,28 31 41 42 50
该列表可以追溯到1997年。我正在尝试根据这些数据预测下一个系列(或尽可能接近的系列):
列表的大小(2336)
我尝试了什么?
到目前为止,我使用的方法是(例如用于1/1/2019,34 44 57 62 70
):
1)获取列表中每个数字的出现次数,即34
出现的次数170
超过列表总数(2336)。
2)查找已出现的每个数字的百分比。即
Perc/Chances(34) = Occurrence/TotalNo.
Chances(34) = 170/2336
Chances(34) = 0.072 ~ 07
获取列表的一种方法是从列表中找到百分比最低的5个数字。但这不会很有效。
另一方面,现在我有一个数据,该数据包含每个数字,其百分比和出现的位置。我有什么方法可以训练预测下一个系列的神经网络?或最接近。
层次结构:
comp_data.csv包含如下数据:
1/1/2019,34 44 57 62 70
12/28/2018,09 10 25 37 38
12/25/2018,02 08 42 43 50
12/21/2018,10 13 61 62 70
12/18/2018,13 22 32 60 69
12/14/2018,05 22 26 43 49
12/11/2018,04 38 39 54 59
12/7/2018,04 10 20 33 57
12/4/2018,28 31 41 42 50
andpetition.csv包含:
34,170
44,197
57,36
62,38
70,37
09,186
10,210
25,197
37,185
38,206
02,217
08,185
and report.csv包含数字,出现次数及其百分比:
34,3,11
44,1,03
57,5,19
62,5,19
70,5,19
09,1,03
10,5,19
25,2,07
37,3,11
38,2,07
02,1,03
08,2,07
因此,我有一系列的列表,一段时间内出现的次数以及百分比。无论如何,我可以创建一个神经网络,该神经网络期望一些INPUTS对数据进行训练并预测OUT(在这种情况下为系列)
问题:
哪个是输入?因为这是一个纯粹的随机问题。 PS。我无法提供任何输入,因为我需要一个没有输入的序列。也许是LSTM回归网络?