我有一个函数正在对熊猫数据框进行一些数据处理。数据框中的列之一是一个numpy数组。我将数据帧保存到一个csv中,然后当我尝试读取它时,它会将数组读取为字符串。我试图弄清楚该如何克服。
处理完数据后,我将数据框写为csv:
df.to_csv('./dataframe')
在另一个笔记本中,我将从内存中读取此数据帧:
df = pd.read_csv('./dataframe')
然后我尝试使用numpy数组提取列,并将它们全部组合为一个大型2D数组:
npArray = np.zeros((df.shape[0], 4000)) #each numpy array
#in the dataframe has 4000 elements
i = 0
for vector in train:
npArray[i] = vector[0]
i += 1
当我尝试执行此操作时,出现以下错误:
ValueError: could not convert string to float: '['
之所以发生这种情况,是因为在我读回文件后,它是作为字符串而不是numpy数组读取的。我尝试在read_csv函数中添加dtype参数并指定np.array,但这也给了我一个错误。
谢谢您的帮助。