在Pandas数据框中连接重复的列

时间:2019-03-21 16:57:02

标签: python pandas dataframe

我有一个具有所有唯一列的数据框,但是,创建后必须使用其字段别名重命名这些列。一些字段别名是重复的,在这种情况下,这些列需要连接在一起成为一个列。值得注意的是,无论哪种情况,值都可以是字符串或整数,也可以包含特殊字符。

  Type Type Project ID
0  AS3        112    1
1  AS4        131    2
2       AS5   115    3
3  AS6        191    4
4       AS7   100    5

当我使用df.groupby(df.columns, axis=1)时,我得到一个空的数据框。但是我假设这是因为groupby返回一个dataframegroupby,而不是实际的数据帧吗?有没有简单的方法可以做到这一点,所以我的输出是:

  Type Project ID
0  AS3   112    1
1  AS4   131    2
2  AS5   115    3
3  AS6   191    4
4  AS7   100    5

2 个答案:

答案 0 :(得分:3)

groupbyfirst一起使用,还请确保您的空格是np.nan,如果不是,请replace

#df=df.replace({'':'np.nan}) or df=df.mask(df=='')
df.groupby(level=0,axis=1).first()

答案 1 :(得分:1)

如果空白为空字符串,求和将有效

<script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/3.3.1/jquery.min.js"></script>
<ul>
  <li>
    <span>
    <span>
    <a href="#" class="current">image</a>
    </span>
    </span>
  </li>
  <li>
    <span>
    <span>
    <a href="#" class="">image</a>
    </span>
    </span>
  </li>
  <li>
    <span>
    <span>
    <a href="#" class="">image</a>
    </span>
    </span>
  </li>
</ul>
<div id="prev">prev</div>
<div id="next">next</div>