我正在尝试使用MLP解决机器学习问题。我有一个包含很多矩阵的特殊文件,每个矩阵有21行和43列,并用********隔开。第一行是模拟,第二行是响应(每列代表一个属性,名称写在文件的开头,但我删除了它们是因为我认为我不需要它们)。
这是我到目前为止编写的代码,我无法避免此错误。我将模拟和模拟的响应分成了一些数组。我想将MLP与第一个仿真和仿真的“矩阵”(例如date_train=simulati[0],etichete_train=matsimulari[0]
)配合使用。
import numpy as np
f=open(r'C:\Users\Europa\Desktop\plantCellSignaling.data')
atr=[line.rstrip('\n') for line in f]
natr=[s.replace('***************************','') for s in atr]
simulari=[]
for i in range(1,5678,22):
simulari.append(natr[i])
#print(simulari[258])
matsimulari=[]
for i in range(2,5698,22):
matsimulari.append(natr[i:(i+20)])
#print (matsimulari[258])
matsimulari2=matsimulari
from sklearn import neural_network
simulari=np.array(simulari).reshape(259,1)
matsimulari=np.array(matsimulari).reshape(259,20)
date_train=simulari
etichete_train=matsimulari
date_test=simulari
clf = neural_network.MLPClassifier()
clf.fit(date_train, etichete_train)
predictii = clf.predict(date_test)