我在包含多个列的工作簿中有Excel工作表。 这些专栏有不同的标题。其中一些可能拥有相同的数据。 这些报告是使用pandas生成的。 如何比较每个工作表上的所有列以及这些列中的任何列上的数据是否相同。 标题是
2014 2015 2016 2017 2018
12. 14. 12. 15. 20
11. 11. 11. 12. 21
您可以看到2014年和2016年持有相同的数据。 如果与2014年匹配,如何删除2016? 我有多张多年的床单。
答案 0 :(得分:1)
你走了:
import pandas as pd
import numpy as np
data = {'2012': ['1', '2', '3', '4', '5'], '2013': ['2', '2', '2', '2',
'2'], '2014': ['1', '2', '3', '4', '5']}
df = pd.DataFrame(data, columns=['2012', '2013', '2014'])
results = df.T.drop_duplicates().T