我有一个数据框,其中一列为字符串,其值用逗号分隔。我想将其展平为仅包含单个字符串值的列,而其他列变为重复列
df = pd.DataFrame({'a':['1,2','4','3,5'], 'b':['a','b','c'], 's':[.1,.2,.3]})
哪个给出这样的数据框:
a b c
'1,2' 'a' .1
'4' 'b' .2
'3,5' 'c' .3
我想将其转换为如下数据框:
df = pd.DataFrame({'a':['1','2','4','3','5'], 'b':['a','a','b','c','c'], 's':[.1,.1,.2,.3,.3]})
喜欢:
a b c
'1' 'a' .1
'2' 'a' .1
'4' 'b' .2
'3' 'c' .3
'5' 'c' .3
我试图通过拆分字符串列来开始这样做
df = df.join(df[a].str.split(',', 1, expand=True))
最后将拆分字符串列追加到新列中,但是我不知所措地完成了任务。任何帮助表示赞赏!