我有一个很大的csv文件,并且不想将它完全加载到我的内存中,我只需要从这个csv文件中获取列名。如何清楚地加载它?
答案 0 :(得分:8)
试试这个:
pd.read_csv(file_name, nrows=1).columns.tolist()
答案 1 :(得分:5)
如果您将nrows=0
传递给read_csv
,那么它只会加载列行:
In[8]:
import pandas as pd
import io
t="""a,b,c,d
0,1,2,3"""
pd.read_csv(io.StringIO(t), nrows=0)
Out[8]:
Empty DataFrame
Columns: [a, b, c, d]
Index: []
之后,访问属性.columns
将为您提供以下列:
In[10]:
pd.read_csv(io.StringIO(t), nrows=0).columns
Out[10]: Index(['a', 'b', 'c', 'd'], dtype='object')