正确格式化CSV格式的数据,以便使用Pandas轻松导入

时间:2016-06-24 12:51:45

标签: python csv pandas

目前,我将以下列方式将数据存储在csv文件中:

a,b,c
1 1 1 1,22 22 22,333 333 333
10 10 10, 20 20 20, 30 30 30

然而,这在Pandas或R的数据框中是一个主要的痛苦,因为默认情况下,每种语言都将值视为字符串。因此,我必须手动将每个字符串修复为一个数组(拆分空格,将字符串转换为浮点数/整数等)。是否有更有效的方式来存储数据,以便我可以立即将数据读取为浮点数组?

1 个答案:

答案 0 :(得分:0)

你可以试试这个:

df[columns] = df[columns].convert_objects(convert_numeric=True)
# astype
df[columns] = df[columns].astype('float32')