Pandas删除匹配的列

时间:2018-02-23 20:33:16

标签: python pandas

我在包含多个列的工作簿中有Excel工作表。 这些专栏有不同的标题。其中一些可能拥有相同的数据。 这些报告是使用pandas生成的。 如何比较每个工作表上的所有列以及这些列中的任何列上的数据是否相同。 标题是

2014  2015  2016 2017  2018
12.    14.  12.   15.   20
11.    11.  11.   12.   21 

您可以看到2014年和2016年持有相同的数据。 如果与2014年匹配,如何删除2016? 我有多张多年的床单。

1 个答案:

答案 0 :(得分:1)

你走了:

   import pandas as pd
   import numpy as np 

   data = {'2012': ['1', '2', '3', '4', '5'], '2013': ['2', '2', '2', '2', 
           '2'], '2014': ['1', '2', '3', '4', '5']}
   df = pd.DataFrame(data, columns=['2012', '2013', '2014'])

   results = df.T.drop_duplicates().T