Question

我已经从几个CSV文件创建了一个熊猫数据框。

现在有一些列代表相同的内容。我想将这些列分组为该数据框中的公共列。

我想要：

谢谢。

Answer 1

假设它们是空字符串`C:/Windows`

将''与可调用对象结合使用，可将groupby转换为'Y'

'X'

否则，请忽略df.mask(df.eq('')).groupby(lambda x: {'Y': 'X'}.get(x, x), axis=1).first() 0 X 0 1 6 1 2 7 2 3 1 3 4 5

mask

Answer 2

可以用fillna

进行检查

df.X.mask(df.X.eq('')).fillna(df.Y)
Out[232]: 
0    6.0
1    7.0
2    1.0
3    5.0
Name: X, dtype: float64

Answer 3

您可以强制dtype为str / object，然后按以下方式进行水平串联/求和：

df = pd.DataFrame({'X': ['6', '', '1', ''], 'Y': ['', 7, '', 5]})

df.astype(str).sum(axis=1)

# returns the following Series which you can assign to a new column of your dataframe
0   6
1   7
2   1
3   5

Python Pandas：如何将两个列分组为一个公共列

3 个答案:

假设它们是空字符串`C:/Windows`

Python Pandas：如何将两个列分组为一个公共列

3 个答案:

假设它们是空字符串C:/Windows

假设它们是空字符串`C:/Windows`