Question

我有一个函数正在对熊猫数据框进行一些数据处理。数据框中的列之一是一个numpy数组。我将数据帧保存到一个csv中，然后当我尝试读取它时，它会将数组读取为字符串。我试图弄清楚该如何克服。

处理完数据后，我将数据框写为csv：

df.to_csv('./dataframe')

在另一个笔记本中，我将从内存中读取此数据帧：

df = pd.read_csv('./dataframe')

然后我尝试使用numpy数组提取列，并将它们全部组合为一个大型2D数组：

npArray = np.zeros((df.shape[0], 4000)) #each numpy array 
                                          #in the dataframe has 4000 elements
i = 0
for vector in train:
    npArray[i] = vector[0]
    i += 1

当我尝试执行此操作时，出现以下错误：

ValueError: could not convert string to float: '['

之所以发生这种情况，是因为在我读回文件后，它是作为字符串而不是numpy数组读取的。我尝试在read_csv函数中添加dtype参数并指定np.array，但这也给了我一个错误。

谢谢您的帮助。

熊猫使用numpy数组列读取数据框

0 个答案: