file.txt
有一个标题和四列。但是标题始终在变化。
类似:
,'non_standard_header_1','non_standard_header_2','non_standard_header_3'
,kdfjlkjdf, sdfdfd,,
,kdfjlkjwwdf, sdfddffd,,
,kdfjlkjwwdf,, sdfddffd,
我想在大熊猫中导入file.txt
,并且希望将列作为object
导入。直观的方法(对我而言):
dtype = [object, object, object]
如下:
daily_file = pandas.read_csv('file.txt',
usecols = [1, 2, 3],
dtype = [object, object, object])
不起作用,运行上面的命令,我得到:
data type not understood
如何在导入时不参考(现有)列名的情况下设置列dtype
?
答案 0 :(得分:2)
pd.read_csv(..., dtype=object)
将在所有需要读入的列中全局应用对象dtype。
否则,如果要将dtypes映射到列名,则需要传递{'col' : dtype}
形式的字典。