如何将列值从csv python转换为数组

时间:2019-03-18 03:48:33

标签: python pandas csv numpy dataset

对不起,我的英语不好,我想将每一行的像素列都转换为独立的numpy数组(如果使用pandas dataframe读取,则其列值将被读取为数组)。 这是我的数据集示例,我尝试过为每个空间分割像素的每一行,但是由于数据集大约有35.000数据并且像素值很长,所以熊猫会出错

  

目标,像素

     

0,12 14 14 16 29 30 29 39 50 60 12 10 0 29 40 14

     

1,13 15 15 17 25 32 23 31 59 62 17 19 1 22 20 20

     

2,12 16 16 18 32 33 22 45 23 12 12 10 2 50 45 13

到 (如果通过数据框读取)

  

目标,像素

     

0,array [12,14,14,16,29,29,39,50,60,12,10,0,29,40,14]

     

1,数组[13,15,15,17,25,32,23,31,59,62,17,19,1,22,20,20]

     

2,array [12,16,16,18,32,33,22,45,23,12,12,10,2,50,45,13]

2 个答案:

答案 0 :(得分:0)

您的问题不太清楚,但希望下面的建议会有所帮助,

尝试转换矩阵中的列 -将其加载到一个numpy数组中,并对其进行整形,以使其处于所需的尺寸

我认为对于图像像素数据,MNIST数据上的Digit Recognizer问题非常有帮助 看看kaggle内核

[https://www.kaggle.com/aman9d/digit-recognizer-svm-88-3-data-visualization/data][1]

答案 1 :(得分:0)

也许还有其他方法可以提高内存效率,但是我想出了一个简单的解决方案,例如:

l = [] # this will be a storage list for your array
for n, row in enumerate(df.index):
    df.iloc[row, :] = l[n]

然后您可以访问列表l中的分隔数组