Question

我正在寻找一种有效的方法来删除带有Pandas的多索引数据框中的重复列。

我的数据：

TypePoint      TIME     Test   ...         T1      T1
-                 S    Unit1   ...       unit    unit
(POINT, -)                     ...                   
24001         90.00  100.000   ...     303.15  303.15
24002        390.00  101.000   ...     303.15  303.15
            ...      ...   ...        ...     ...
24801         10000  102.000   ...     303.15  303.15
24802         10500  103.000   ...     303.15  303.15

标题包含两个信息。变量的名称及其单位。我想删掉变量＆＃34; T1＆＃34; （重复变量）。

.drop_duplicates（）不能正常工作。我得到＆＃34;缓冲区的维数错误（预期为1，得到2）＆＃34;错误。
。drop（数据（＆＃39; T1＆＃39;，＆＃39;单位＆＃39;），轴= 1）也不能正常工作。这使得两列不仅仅是其中一列。

感谢您的帮助

Answer 1

我认为你可以使用双T：

print df
  TypePoint   TIME  Test      T1        
          -      S Unit1    unit    unit
0     24001     90   100  303.15  303.15
1     24002    390   101  303.15  303.15
2     24801  10000   102  303.15  303.15
3     24802  10500   103  303.15  303.15

print df.T.drop_duplicates().T
  TypePoint   TIME  Test      T1
          -      S Unit1    unit
0     24001     90   100  303.15
1     24002    390   101  303.15
2     24801  10000   102  303.15
3     24802  10500   103  303.15

删除pandas中的multiindex数据帧中的重复项

1 个答案: