如何在熊猫数据框中使用单引号将一列分为两部分?

时间:2018-11-08 19:01:35

标签: python pandas

我有一列数据框(samplename_date)如下所示:

  

'008Q06-03 RGD17-48 3.8W Wm 1xtl'7月3日

在第二个单引号之后,我试图将其分为两列。我一直在尝试:

temp[['samplename','date']] = df['samplename_date'].str.split(''\s', expand = True)

及其变体,但我似乎无法弄清楚如何在正则表达式模式中处理单引号。

1 个答案:

答案 0 :(得分:0)

您还需要转义单引号

temp[['samplename','date']] = df['samplename_date'].str.split('\'\s', expand = True)

你得到

    samplename                          date
0   '008Q06-03 RGD17-48 3.8W Wm 1xtl    03 July

我个人会使用str.extract

temp[['samplename','date']] = df['samplename_date'].str.extract('\'(.*)\'\s(.*)', expand = True)


    samplename                      date
0   008Q06-03 RGD17-48 3.8W Wm 1xtl 03 July