我有一个这种格式的数据框,但是有几百行和更多列:
df = pd.DataFrame({'col1': ['A', 'B', 'C'],
'col2': ['1, 5, 10', '1, 10, 20', '1, 5, 10'],
'col3': ['2, 10, 20', '2, 10, 20', 'None']})
我不想重新排列df,所以要重新排列df,以便col1
中的每个值在许多行中重复,并以这种方式重新排列值:
dfoutput = pd.DataFrame({'col1': ['A', 'A', 'B', 'B', 'C'],
'col2': ['1, 5, 10', '2, 10, 20', '1, 10, 20', '2, 10, 20', '1, 5, 10']})
我尝试使用df.melt
和df.groupby
的组合,但是我一无所获。我还发现了this solution,但是我有数百列要拆分而不是1(并且它们不是元组)。我还摆弄了答案given here,但df组织的差异足够大,以至于我无法使其适用于我的df。