我曾尝试用一层构建CNN,但我遇到了一些问题。 确实,编译器说我
ValueError:检查模型输入时出错:期望conv1d_1_input 有三个尺寸,但有阵形(569,30)
这是代码
import numpy
from keras.models import Sequential
from keras.layers.convolutional import Conv1D
numpy.random.seed(7)
datasetTraining = numpy.loadtxt("CancerAdapter.csv",delimiter=",")
X = datasetTraining[:,1:31]
Y = datasetTraining[:,0]
datasetTesting = numpy.loadtxt("CancereEvaluation.csv",delimiter=",")
X_test = datasetTraining[:,1:31]
Y_test = datasetTraining[:,0]
model = Sequential()
model.add(Conv1D(2,2,activation='relu',input_shape=X.shape))
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
model.fit(X, Y, epochs=150, batch_size=5)
scores = model.evaluate(X_test, Y_test)
print("\n%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))
答案 0 :(得分:91)
<强> TD; lr 您需要重塑数据以使Conv1d
的空间维度有意义:
X = np.expand_dims(X, axis=2) # reshape (569, 30) to (569, 30, 1)
# now input can be set as
model.add(Conv1D(2,2,activation='relu',input_shape=(30, 1))
基本上重塑一个如下所示的数据集:
features
.8, .1, .3
.2, .4, .6
.7, .2, .1
要:
[[.8
.1
.3],
[.2,
.4,
.6
],
[.3,
.6
.1]]
解释和示例
通常卷积在空间维度上起作用。内核被&#34;卷积&#34;在产生张量的维度上。在Conv1D的情况下,内核通过“步骤”传递。每个例子的维度。
你会看到在NLP中使用的Conv1D,其中steps
是句子中的单词数(填充到某个固定的最大长度)。这些单词可能被编码为长度为4的向量。
这是一个例句:
jack .1 .3 -.52 |
is .05 .8, -.7 |<--- kernel is `convolving` along this dimension.
a .5 .31 -.2 |
boy .5 .8 -.4 \|/
在这种情况下我们将输入设置为conv的方式:
maxlen = 4
input_dim = 3
model.add(Conv1D(2,2,activation='relu',input_shape=(maxlen, input_dim))
在您的情况下,您将把要素视为空间维度,每个要素的长度为1.(见下文)
以下是您的数据集
的示例att1 .04 |
att2 .05 | < -- kernel convolving along this dimension
att3 .1 | notice the features have length 1. each
att4 .5 \|/ example have these 4 featues.
我们将Conv1D示例设置为:
maxlen = num_features = 4 # this would be 30 in your case
input_dim = 1 # since this is the length of _each_ feature (as shown above)
model.add(Conv1D(2,2,activation='relu',input_shape=(maxlen, input_dim))
如您所见,您的数据集必须重新整形为(569,30,1) 使用方法:
X = np.expand_dims(X, axis=2) # reshape (569, 30, 1)
# now input can be set as
model.add(Conv1D(2,2,activation='relu',input_shape=(30, 1))
以下是一个可以运行的完整示例(我将使用Functional API)
from keras.models import Model
from keras.layers import Conv1D, Dense, MaxPool1D, Flatten, Input
import numpy as np
inp = Input(shape=(5, 1))
conv = Conv1D(filters=2, kernel_size=2)(inp)
pool = MaxPool1D(pool_size=2)(conv)
flat = Flatten()(pool)
dense = Dense(1)(flat)
model = Model(inp, dense)
model.compile(loss='mse', optimizer='adam')
print(model.summary())
# get some data
X = np.expand_dims(np.random.randn(10, 5), axis=2)
y = np.random.randn(10, 1)
# fit model
model.fit(X, y)
答案 1 :(得分:2)
在预处理后,无法查看更多详细信息,您的数据形状不正确 重塑X有3个维度:
np.reshape(X, (1, X.shape[0], X.shape[1]))
答案 2 :(得分:2)
我在其他帖子中也提到了这一点:
要将形状为(nrows, ncols)
的常用特征表数据输入到Keras的Conv1d,需要执行以下两个步骤:
xtrain.reshape(nrows, ncols, 1)
# For conv1d statement:
input_shape = (ncols, 1)
例如,获取虹膜数据集的前4个特征:
要查看常用格式及其形状:
iris_array = np.array(irisdf.iloc[:,:4].values)
print(iris_array[:5])
print(iris_array.shape)
输出显示通常的格式及其形状:
[[5.1 3.5 1.4 0.2]
[4.9 3. 1.4 0.2]
[4.7 3.2 1.3 0.2]
[4.6 3.1 1.5 0.2]
[5. 3.6 1.4 0.2]]
(150, 4)
以下代码更改了格式:
nrows, ncols = iris_array.shape
iris_array = iris_array.reshape(nrows, ncols, 1)
print(iris_array[:5])
print(iris_array.shape)
上述代码数据格式及其形状的输出:
[[[5.1]
[3.5]
[1.4]
[0.2]]
[[4.9]
[3. ]
[1.4]
[0.2]]
[[4.7]
[3.2]
[1.3]
[0.2]]
[[4.6]
[3.1]
[1.5]
[0.2]]
[[5. ]
[3.6]
[1.4]
[0.2]]]
(150, 4, 1)
这对于Keras的Conv1d非常有效。因为input_shape (4,1)
是必需的。
答案 3 :(得分:0)
我有一个稀疏矩阵作为输入,因此如果不转换为通常的数组就无法重塑它
解决方案是使用keras Reshape层:
from keras.layers.core import Reshape
...
model = Sequential()
model.add(Reshape((X.shape[1], 1), input_shape=(X.shape[1], )))
model.add(Conv1D(2,2,activation='relu'))
...
答案 4 :(得分:0)
对于稀疏矩阵,在我的情况下,行:73196,列:101我用array_ = sparse_matrix.A
将稀疏矩阵转换为数组后,使用了numpy的重塑函数,然后使用下面的代码
x_train_all = np.reshape(array_ , (73196, 101,1))
在输入层中,我使用了以下代码:
input2 = Input(shape=(101,1), dtype='float32', name='input2')