熊猫使用numpy数组列读取数据框

时间:2018-07-02 19:33:01

标签: python pandas csv numpy dataframe

我有一个函数正在对熊猫数据框进行一些数据处理。数据框中的列之一是一个numpy数组。我将数据帧保存到一个csv中,然后当我尝试读取它时,它会将数组读取为字符串。我试图弄清楚该如何克服。

处理完数据后,我将数据框写为csv:

df.to_csv('./dataframe')

在另一个笔记本中,我将从内存中读取此数据帧:

df = pd.read_csv('./dataframe')

然后我尝试使用numpy数组提取列,并将它们全部组合为一个大型2D数组:

npArray = np.zeros((df.shape[0], 4000)) #each numpy array 
                                          #in the dataframe has 4000 elements
i = 0
for vector in train:
    npArray[i] = vector[0]
    i += 1

当我尝试执行此操作时,出现以下错误:

ValueError: could not convert string to float: '['

之所以发生这种情况,是因为在我读回文件后,它是作为字符串而不是numpy数组读取的。我尝试在read_csv函数中添加dtype参数并指定np.array,但这也给了我一个错误。

谢谢您的帮助。

0 个答案:

没有答案