我的4D Numpy
数组的形状为(202, 64, 64, 3)
,因此第一个维度是图像的索引,最后3个维度是实际图像。
然后我有'2D Numpy'数组形状'(202,1)'包含每个图像的标签
我想创建一个包含两列'Pixel Array'和'Labels'的pandas数据框,这样我就可以执行一些操作如何做到这一点?
Train = pd.DataFrame({'Pixel':X, 'Labels':Y})
给我错误:
ValueError: If using all scalar values, you must pass an index
如何将numpy转换为数据帧?
答案 0 :(得分:0)
以下适用于随机生成的大小测试集(50,20,20,3)。我在这里做了两个假设:
1)您的数据称为datalist
2)指数实际上并没有存储在矩阵中(我在脑海中看到4D矩阵时遇到了麻烦)
Y = np.arange(datalist.shape[0],dtype=int)
X = [data for data in datalist]
Train = pd.DataFrame({'Pixel':X, 'Labels':Y})