Python,pandas将列拆分为两个

时间:2017-04-17 00:52:20

标签: python pandas dataframe multiple-columns

我有一个包含多列的数据框,其中一列是日期列。目前该列中的数据采用以下格式:02/01/2012 9:30

但是我想把它分成两个单独的栏目,日期:02/01/2012和时间:9:30

我找到了以下解决方案:

df = pd.DataFrame(df.date.str.split(' ',1).tolist(), columns = ['date','time'])

但是,这会创建一个新的数据框,其中只包含两个新的拆分列,而不包含其他列。

有没有办法在不创建新数据框的情况下拆分现有数据框的列?

解决此问题的计算效率最高的方法是什么? (我正在使用的数据集包含大约2000万行)

2 个答案:

答案 0 :(得分:3)

试试这个:

Alabama
Florida
Kentucky

演示

df[['date','time']] = df.pop('date').str.split(expand=True)

答案 1 :(得分:3)

如果您的date列是字符串,而您只是想将它们拆分......那么这应该可行

date_time = df.date.str.split(expand=True).rename(columns={0: 'date', 1: 'time'})
df = df.drop('date', 1).join(date_time)
print(df)

   A  B        date  time
0  1  2  02/01/2012  9:30

<强> 设置
假设数据框df

df = pd.DataFrame(dict(date=['02/01/2012 9:30'], A=[1], B=[2]))

print(df)

   A  B             date
0  1  2  02/01/2012 9:30

但是,假设您的date列实际上是日期时间

df = pd.DataFrame(dict(date=pd.to_datetime(['02/01/2012 9:30']), A=[1], B=[2]))

print(df)

   A  B                date
0  1  2 2012-02-01 09:30:00

然后我们

df = df.assign(date=df.date.dt.date, time=df.date.dt.time)

print(df)

   A  B                date
0  1  2 2012-02-01 09:30:00