Keras和LSTM中的二进制分类

时间:2018-06-13 14:39:52

标签: python tensorflow keras deep-learning classification

我有一个二进制分类问题让我对使用LSTM进行建模的输入和输出感到非常困惑。 我想输入5行数据集,并获得第6行的标签颜色。 我的X有5个功能:rb,us,ls,Volume,pos 我的Y是1或0的标签 我的数据框:

         rb        us        ls    Volume  pos  color
0  0.080071  1.000000  0.964286  0.020507    1      1
1  0.017798  0.857143  0.857143  0.017643    1      1
2  0.026698  0.642857  0.500000  0.031085    4      1
3  0.029666  0.833333  1.000000  0.011411    2      0
4  0.008899  0.500000  1.000000  0.008371    4      0

我像这样制作一个5行的序列:

[[1.77976353e-02 8.57142857e-01 8.57142857e-01 1.76426968e-02
   1.00000000e+00]
  [2.66977791e-02 6.42857143e-01 5.00000000e-01 3.10845400e-02
   4.00000000e+00]
  [2.96664095e-02 8.33333333e-01 1.00000000e+00 1.14109866e-02
   2.00000000e+00]
  [8.89918602e-03 5.00000000e-01 1.00000000e+00 8.37062257e-03
   4.00000000e+00]
  [1.48316083e-02 8.33333333e-01 1.00000000e+00 8.47275749e-03
   2.00000000e+00]]

我应该如何对第6行的Y进行分类?我的意思是如何分类下一个序列的第6行或第一个下一个项目?我需要以某种方式向网络声明它吗? 我的网络输入/输出有问题吗?如何获得第6项标签颜色的标签(二进制分类)? 我的代码:

import pandas as pd
from Util import window_nd as Reshape
from keras.utils import to_categorical
from keras.layers import Dense,RNN,LSTM,Activation,Dropout
from keras.models import Sequential


df = pd.read_csv('./EURUSD_DATAFRAME.csv')
print(df.head())
df['pos'] = df['pos'].astype('int')
dat = df.values

X = dat[0:30004,0:5]
Y = dat[0:30000,5]
X = Reshape(X,5)  #It's a custom function which reshaped the X to serialized (5,5) 
#Shape of X is  (30000, 5, 5)

Y = to_categorical(Y,num_classes=2)

model = Sequential()
model.add(LSTM(25,input_shape=(5,5),return_sequences=True))
model.add(Activation('relu'))
model.add(Dropout(0.2))
model.add(LSTM(1))
model.add(Activation('relu'))
model.add(Dense(2))
model.add(Activation('sigmoid'))
model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy'])
model.fit(X,Y,batch_size=5,epochs=10,validation_split=0.2)
p = model.predict(X)
print(p)

1 个答案:

答案 0 :(得分:1)

我不确定你的意思是“如何对第6行进行分类”。让我试着澄清一般情况。也许这会有所帮助。

您输入的是一个5x5矩阵(按5个时间步长解释每个5个功能),您的输出是您尝试分类的2个类的对数。这两个类是否对应于“第6行”取决于您。更准确地说,直到你如何设置你的Y.如果你的Y是网络将学会预测的“第6行”的类。

您还可以查看类似的问题:Understanding Keras LSTMs