想在python中更快地构造数据框架

时间:2016-12-06 06:25:18

标签: python pandas

我想通过连接到具有GPU的群集来创建数据框。我写的代码基本上是创建CIFAR图像数据集的数据帧。代码如下:

import Image
import numpy as np
import os
import glob
import pandas as pd
os.chdir('./train')
for file in list(glob.glob('*.png')):
    img = Image.open(file)
    img.load()
    data = np.asarray( img, dtype="int32")
    a = np.array(data)
    b = a.ravel()
    c = a.flatten()
    #print(c)
    df = pd.DataFrame([c])
    df = df.append(df, ignore_index = True)

由于训练数据集中的大量图像需要花费大量时间,因此如何更快地获得结果。提前致谢

0 个答案:

没有答案