对不起,我的英语不好,我想将每一行的像素列都转换为独立的numpy数组(如果使用pandas dataframe读取,则其列值将被读取为数组)。 这是我的数据集示例,我尝试过为每个空间分割像素的每一行,但是由于数据集大约有35.000数据并且像素值很长,所以熊猫会出错
目标,像素
0,12 14 14 16 29 30 29 39 50 60 12 10 0 29 40 14
1,13 15 15 17 25 32 23 31 59 62 17 19 1 22 20 20
2,12 16 16 18 32 33 22 45 23 12 12 10 2 50 45 13
到 (如果通过数据框读取)
目标,像素
0,array [12,14,14,16,29,29,39,50,60,12,10,0,29,40,14]
1,数组[13,15,15,17,25,32,23,31,59,62,17,19,1,22,20,20]
2,array [12,16,16,18,32,33,22,45,23,12,12,10,2,50,45,13]
答案 0 :(得分:0)
您的问题不太清楚,但希望下面的建议会有所帮助,
尝试转换矩阵中的列 -将其加载到一个numpy数组中,并对其进行整形,以使其处于所需的尺寸
我认为对于图像像素数据,MNIST数据上的Digit Recognizer问题非常有帮助 看看kaggle内核
[https://www.kaggle.com/aman9d/digit-recognizer-svm-88-3-data-visualization/data][1]
答案 1 :(得分:0)
也许还有其他方法可以提高内存效率,但是我想出了一个简单的解决方案,例如:
l = [] # this will be a storage list for your array
for n, row in enumerate(df.index):
df.iloc[row, :] = l[n]
然后您可以访问列表l中的分隔数组