使用复合索引重新索引DataFrame

时间:2017-11-01 22:51:55

标签: pandas dataframe python-3.6

我必须使用' index_col = False'从文本文件加载我的DataFrame。选项以避免标题和记录之间的偏移。

现在DataFrame已正确加载和清理,我需要根据由前4列组成的键重新索引。

Q1:推荐选项:我应该使用复合键创建一个额外的列还是有更有效的替代方案? Q2:如果我需要根据复合键重新索引,有关如何在DataFrame中执行此操作的任何提示吗?

1 个答案:

答案 0 :(得分:1)

您可以使用set_index([col1,col2,col3,col4],inplace=True)将4列放在索引中。您可以参考文档:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.set_index.html 如果要检查索引的唯一性,还可以添加选项verify_integrity=True