我必须使用' index_col = False'从文本文件加载我的DataFrame。选项以避免标题和记录之间的偏移。
现在DataFrame已正确加载和清理,我需要根据由前4列组成的键重新索引。
Q1:推荐选项:我应该使用复合键创建一个额外的列还是有更有效的替代方案? Q2:如果我需要根据复合键重新索引,有关如何在DataFrame中执行此操作的任何提示吗?
答案 0 :(得分:1)
您可以使用set_index([col1,col2,col3,col4],inplace=True)
将4列放在索引中。您可以参考文档:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.set_index.html
如果要检查索引的唯一性,还可以添加选项verify_integrity=True
。