在熊猫中,我试图将字符上的一列分为两列,并希望保留字符定界符。
我尝试过str.split(),它按照我想要的方式拆分列,但是它删除了字符定界符(应该是这样)。
我的专栏看起来像这样。
mor
0 HR Ncfsa
我正在使用以下代码:
df[['mor1', 'mor2']] = df['mor'].str.split(pat='^[A-Z]', n=-1, expand=True)
我知道
mor1 mor2
0 R Ncfsa
但是我想保留原始列的第一个字母以获得:
mor1 mor2
0 H R Ncfsa
答案 0 :(得分:1)
IIUC,使用Series.str.extract
df['mor'].str.extract('^(?P<mor1>[A-Z])(?P<mor2>.*)$')
[出]
mor1 mor2
0 H R Ncfsa