在Pandas数据框上应用列表

时间:2018-12-20 08:59:43

标签: python pandas list string-concatenation

我需要按列将列表应用于熊猫数据框。要执行的操作是字符串连接。更具体:

我有输入:

df = pd.DataFrame([['a', 'b', 'c'], ['d', 'e', 'f']], columns=['Col1', 'Col2', 'Col3'])
lt = ['Prod1', 'Prod2', 'Prod3']

结果为:

>>>df
Col1 Col2 Col3
0    a    b    c
1    d    e    f

>>>lt
['Prod1', 'Prod2', 'Prod3']

此外,lt的长度将始终等于df的列数。

我想要的是这种数据框:

res = pd.DataFrame([['Prod1a', 'Prod2b', 'Prod3c'], ['Prod1d', 'Prod2e', 'Prod3f']],
               columns=['Col1', 'Col2', 'Col3'])

给出:

>>>res
Col1    Col2    Col3
0  Prod1a  Prod2b  Prod3c
1  Prod1d  Prod2e  Prod3f

直到现在,我已经能够解决在行和列之间循环的问题,但我不会放弃有一种更优雅的方式来解决它的想法(也许像apply这样。

有人有建议吗?谢谢!

1 个答案:

答案 0 :(得分:3)

您可以执行广播的字符串连接:

lt + df

     Col1    Col2    Col3
0  Prod1a  Prod2b  Prod3c
1  Prod1d  Prod2e  Prod3f

您还可以使用numpy的np.char.add函数。

df[:] = np.char.add(lt, df.values.astype(str))
df    
     Col1    Col2    Col3
0  Prod1a  Prod2b  Prod3c
1  Prod1d  Prod2e  Prod3f

第三,有列表理解选项。

df[:] = [[i + v for i, v in zip(lt, V)] for V in df.values.tolist()]
df

     Col1    Col2    Col3
0  Prod1a  Prod2b  Prod3c
1  Prod1d  Prod2e  Prod3f