我想从我的数据集中删除多个列。这些列是随机位置,我有他们的名字。 目前我删除它们如下。
import pandas as pd
data = pd.read_csv('data.cvs')
del data['021']
del data['hg1']
del data['3bm']
del data['og1']
del data['36m']
del data['y7p']
del data['dk4']
有人可以告诉我如何在更少的代码行中简化列的删除。
答案 0 :(得分:0)
试试这个:
pd.read_csv('data.cvs').drop(['col1','col2'], axis=1)
如果您事先知道所需列的列表,请或更好地使用usecols
参数:
pd.read_csv('data.cvs', usecols=['col_A','col_B'])
在这种情况下,Pandas不会为不需要的列分配内存,而且它也会更快地工作