熊猫指定数据类型

时间:2020-02-24 08:12:50

标签: python pandas

pandasframe_datatypes= ['A':int64, 'B':object, 'C':object, 'D':object, 'E':float64]

它的用法如下:

test = pd.read_csv("test.csv", sep=";", names=pandasframe_names, dtype=pandasframe_datatypes)

但是它给出了语法错误,这是什么问题?

A是整数,B和C,D是字符串,E是浮点数。

正确答案会是什么样?

我的csv也有一个标题列,如果我指定名称,则第一列会加倍。也有解决方案吗?

1 个答案:

答案 0 :(得分:3)

更改无效的词典:

import numpy as np

pandasframe_datatypes= ['A':int64, 'B':object, 'C':object, 'D':object, 'E':float64]

有效的字典,也对数字列使用有效的dtype

pandasframe_datatypes= {'A':np.int64, 'B': object, 'C': object, 'D':object, 'E': np.float64}

或者:

pandasframe_datatypes= {'A':'int64', 'B': object, 'C': object, 'D':object, 'E': 'float64'}