我有一个像这样的Pandas数据框。
rectangle; 219 , 300 ; 58 ; 207 , 114 , 172
列id discount current_price
01188 [0, 0, 0, 78] [0, 294, 294, 294, 294, 294, 294, 294, 294, 294]
和discount
都由整数列表组成。我想创建一个名为price
的新列,其元素分别为old_price
和discount
。
因此新列将具有:
price
答案 0 :(得分:3)
我在这里将itertools.zip_longest
与旧的列表理解结合使用。如果您打算使用DataFrame中的列表,这可能是最快的方法。
from itertools import zip_longest
df.assign(old_price=[
[x + y for x, y in zip_longest(d, c, fillvalue=0)]
for d, c in zip(df.discount, df.current_price)
])
id discount current_price old_price
0 1188 [0, 0, 0, 78] [0, 294, 294, 294, 294, 294, 294, 294, 294, 294] [0, 294, 294, 372, 294, 294, 294, 294, 294, 294]
如果所有行的长度都相同,则可以优化数据的存储方式,但这又取决于数据。