使用列和行索引作为变量填充熊猫数据框

时间:2019-06-01 13:27:49

标签: python pandas dataframe data-munging

概述

如何使用数学方法填充熊猫数据框,该数学方法使用列和行索引作为变量。

设置

import pandas as pd
import numpy as np

df = pd.DataFrame(index = range(5), columns = ['Combo_Class0', 'Combo_Class1', 'Combo_Class2', 'Combo_Class3', 'Combo_Class4'])

客观

df中的每个单元格=行索引*(列索引+ 2)

Final Objective

尝试1

您可以使用this解决方案来生成以下代码:

row = 0
for i in range(5):
    row = row + 1
    df.loc[i] = [(row)*(1+2), (row)*(2+2), (row)*(3+2), (row)*(4+2), (row)*(4+2), (row)*(5+2)]

尝试2

This解决方案似乎也很相关,尽管我相信我已经读过您不应该遍历数据帧。此外,我没有看到如何遍历列:

for i, j in df.iterrows(): 
    df.loc[i] = i

2 个答案:

答案 0 :(得分:2)

您可以利用broadcasting获得更有效的方法:

ix = (df.index+1).to_numpy() # .values for pandas 0.24< 
df[:] = ix[:,None] * (ix+2)

print(df)

        Combo_Class0  Combo_Class1  Combo_Class2  Combo_Class3  Combo_Class4
0             3             4             5             6             7
1             6             8            10            12            14
2             9            12            15            18            21
3            12            16            20            24            28
4            15            20            25            30            35

答案 1 :(得分:2)

Using multiply outer

df[:]=np.multiply.outer((np.arange(5)+1),(np.arange(5)+3))