我有一个二进制分类问题让我对使用LSTM进行建模的输入和输出感到非常困惑。 我想输入5行数据集,并获得第6行的标签颜色。 我的X有5个功能:rb,us,ls,Volume,pos 我的Y是1或0的标签 我的数据框:
rb us ls Volume pos color
0 0.080071 1.000000 0.964286 0.020507 1 1
1 0.017798 0.857143 0.857143 0.017643 1 1
2 0.026698 0.642857 0.500000 0.031085 4 1
3 0.029666 0.833333 1.000000 0.011411 2 0
4 0.008899 0.500000 1.000000 0.008371 4 0
我像这样制作一个5行的序列:
[[1.77976353e-02 8.57142857e-01 8.57142857e-01 1.76426968e-02
1.00000000e+00]
[2.66977791e-02 6.42857143e-01 5.00000000e-01 3.10845400e-02
4.00000000e+00]
[2.96664095e-02 8.33333333e-01 1.00000000e+00 1.14109866e-02
2.00000000e+00]
[8.89918602e-03 5.00000000e-01 1.00000000e+00 8.37062257e-03
4.00000000e+00]
[1.48316083e-02 8.33333333e-01 1.00000000e+00 8.47275749e-03
2.00000000e+00]]
我应该如何对第6行的Y进行分类?我的意思是如何分类下一个序列的第6行或第一个下一个项目?我需要以某种方式向网络声明它吗? 我的网络输入/输出有问题吗?如何获得第6项标签颜色的标签(二进制分类)? 我的代码:
import pandas as pd
from Util import window_nd as Reshape
from keras.utils import to_categorical
from keras.layers import Dense,RNN,LSTM,Activation,Dropout
from keras.models import Sequential
df = pd.read_csv('./EURUSD_DATAFRAME.csv')
print(df.head())
df['pos'] = df['pos'].astype('int')
dat = df.values
X = dat[0:30004,0:5]
Y = dat[0:30000,5]
X = Reshape(X,5) #It's a custom function which reshaped the X to serialized (5,5)
#Shape of X is (30000, 5, 5)
Y = to_categorical(Y,num_classes=2)
model = Sequential()
model.add(LSTM(25,input_shape=(5,5),return_sequences=True))
model.add(Activation('relu'))
model.add(Dropout(0.2))
model.add(LSTM(1))
model.add(Activation('relu'))
model.add(Dense(2))
model.add(Activation('sigmoid'))
model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy'])
model.fit(X,Y,batch_size=5,epochs=10,validation_split=0.2)
p = model.predict(X)
print(p)
答案 0 :(得分:1)
我不确定你的意思是“如何对第6行进行分类”。让我试着澄清一般情况。也许这会有所帮助。
您输入的是一个5x5矩阵(按5个时间步长解释每个5个功能),您的输出是您尝试分类的2个类的对数。这两个类是否对应于“第6行”取决于您。更准确地说,直到你如何设置你的Y.如果你的Y是网络将学会预测的“第6行”的类。
您还可以查看类似的问题:Understanding Keras LSTMs