我有一个包含13列的.xlsx文件。我需要将一列中的字符串中的文本专门提取/复制到新列中。列中的字符串由下划线(_)分隔符构成:
TextA_TextB - TextB_TextC_TextD_TextE_TextF
我需要将TextA专门复制到新列中。这里最好的方法是什么?
答案 0 :(得分:0)
你可以试试这个。
在DataFrame中有列
In [30]: df
Out[30]:
a
0 test1_test2_tes3_test4
In [31]: df['a'] = df['a'].apply(lambda x: x.split('_'))
In [33]: df = pd.concat([df, df['a'].apply(pd.Series)], axis=1)
In [34]: df
Out[34]:
a 0 1 2 3
0 [test1, test2, tes3, test4] test1 test2 tes3 test4