Question

pandasframe_datatypes= ['A':int64, 'B':object, 'C':object, 'D':object, 'E':float64]

它的用法如下：

test = pd.read_csv("test.csv", sep=";", names=pandasframe_names, dtype=pandasframe_datatypes)

但是它给出了语法错误，这是什么问题？

A是整数，B和C，D是字符串，E是浮点数。

正确答案会是什么样？

我的csv也有一个标题列，如果我指定名称，则第一列会加倍。也有解决方案吗？

Answer 1

更改无效的词典：

import numpy as np

pandasframe_datatypes= ['A':int64, 'B':object, 'C':object, 'D':object, 'E':float64]

有效的字典，也对数字列使用有效的dtype：

pandasframe_datatypes= {'A':np.int64, 'B': object, 'C': object, 'D':object, 'E': np.float64}

或者：

pandasframe_datatypes= {'A':'int64', 'B': object, 'C': object, 'D':object, 'E': 'float64'}