我遇到了一个问题,我想将日期格式更改为月/日/年,但是日期还有其他信息。我想保持这种格式,只更改日期格式,并且我不希望日期没有单独的列,并且单元格不均匀,因此某些单元格有时具有10个事件历史记录,而某些单元格具有0或1。
incident # incident history
0 137224 Class II : R : 20180920
1 137219 Class II : O : 20181119,Class II : O : 20181119,Class O : D1 : 20170601
2 137211 Class O : D1 : 20190219
我能够用逗号替换新行,并使用逗号根据创建的拆分数量进行拆分和创建新列(例如,在此示例中,由于事件137219最长,因此为3),因此我可以更改日期格式,但我被困在这一部分
import pandas as pd
df = pd.read_excel(C:/blabla)
df['incident history'] = (df['incident history'].replace('\\n',',', regex = True))
df = df.join(df['incident history'].str.split(',', expand=True).add_prefix('Incident_History_').fillna(np.nan))
df = df.loc[:, df.columns.str.startswith('Incident_History_')]
我希望这样:
incident # incident history
0 137224 Class II : R : 09-20-2018
1 137219 Class II : O : 11-19-2018,Class II : O : 11-19-2018,Class O : D1 : 06-01-2017
2 137211 Class O : D1 : 02-19-2019
但是,如果可以用逗号代替它,也可以是这样的新行
incident # incident history
0 137224 Class II : R : 09-20-2018
1 137219 Class II : O : 11-19-2018
Class II : O : 11-19-2018
Class O : D1 : 06-01-2017
2 137211 Class O : D1 : 02-19-2019