Question

对不起，我的英语不好，我想将每一行的像素列都转换为独立的numpy数组（如果使用pandas dataframe读取，则其列值将被读取为数组）。这是我的数据集示例，我尝试过为每个空间分割像素的每一行，但是由于数据集大约有35.000数据并且像素值很长，所以熊猫会出错

目标，像素

0，12 14 14 16 29 30 29 39 50 60 12 10 0 29 40 14

1，13 15 15 17 25 32 23 31 59 62 17 19 1 22 20 20

2，12 16 16 18 32 33 22 45 23 12 12 10 2 50 45 13

到（如果通过数据框读取）

目标，像素

0，array [12,14,14,16,29,29,39,50,60,12,10,0,29,40,14]

1，数组[13,15,15,17,25,32,23,31,59,62,17,19,1,22,20,20]

2，array [12,16,16,18,32,33,22,45,23,12,12,10,2,50,45,13]

Answer 1

您的问题不太清楚，但希望下面的建议会有所帮助，

尝试转换矩阵中的列 -将其加载到一个numpy数组中，并对其进行整形，以使其处于所需的尺寸

我认为对于图像像素数据，MNIST数据上的Digit Recognizer问题非常有帮助看看kaggle内核

[https://www.kaggle.com/aman9d/digit-recognizer-svm-88-3-data-visualization/data][1]

Answer 2

也许还有其他方法可以提高内存效率，但是我想出了一个简单的解决方案，例如：

l = [] # this will be a storage list for your array
for n, row in enumerate(df.index):
    df.iloc[row, :] = l[n]

然后您可以访问列表l中的分隔数组

如何将列值从csv python转换为数组

2 个答案: