pandasframe_datatypes= ['A':int64, 'B':object, 'C':object, 'D':object, 'E':float64]
它的用法如下:
test = pd.read_csv("test.csv", sep=";", names=pandasframe_names, dtype=pandasframe_datatypes)
但是它给出了语法错误,这是什么问题?
A是整数,B和C,D是字符串,E是浮点数。
正确答案会是什么样?
我的csv也有一个标题列,如果我指定名称,则第一列会加倍。也有解决方案吗?
答案 0 :(得分:3)
更改无效的词典:
import numpy as np
pandasframe_datatypes= ['A':int64, 'B':object, 'C':object, 'D':object, 'E':float64]
有效的字典,也对数字列使用有效的dtype
:
pandasframe_datatypes= {'A':np.int64, 'B': object, 'C': object, 'D':object, 'E': np.float64}
或者:
pandasframe_datatypes= {'A':'int64', 'B': object, 'C': object, 'D':object, 'E': 'float64'}