如何使用其他列中的日期/时间信息在熊猫中创建新列

时间:2020-04-24 14:19:46

标签: python pandas datetime

我有一个数据集,其中的年/月/日/小时/分钟/秒数据存储在单独的列中:

Day,Date,Month,Year,Hour,Min,Sec,Wind dir,WS (m/s),Press (hPa),RH (%),T(C),Td(C),SR (W/m2)
Thu,11,April,2019,16,23,27,31,1.28,993.4,38,7,-6.1,470
Thu,11,April,2019,16,24,27,103,1.21,993.5,39,7,-5.9,515

我已将其从csv文件导入到Pandas数据框中:

df = pd.read_csv('/ Users / jacks / Downloads / Cornell / SP20 / Instrumentation / Lab 5 / EAS2500_MetPak11_18April2019.csv',engine ='python')

我想在此数据框中创建一个新列,以datetime格式存储日期/时间数据。我已经使用以下代码尝试过此操作:

df["Date_Time"] = datetime(df["Year"],df["Month"],df["Day"],df["Hour"],df["Min"],df["Sec"])

但是出现以下错误:

raise TypeError(f"cannot convert the series to {converter}")
TypeError: cannot convert the series to <class 'int'>

为什么不起作用,我将如何完成这项任务?

3 个答案:

答案 0 :(得分:2)

使用:

df_time = df[["Year", "Month", "Date", "Hour", "Min", "Sec"]].astype(str).agg("".join, axis=1)
df["Date_Time"] = pd.to_datetime(df_time, format="%Y%B%d%H%M%S")

print(df["Date_Time"])

此打印:

0   2019-04-11 16:23:27
1   2019-04-11 16:24:27
Name: Date_Time, dtype: datetime64[ns]

答案 1 :(得分:0)

正在回答的问题:如何将月份名称转换为数字。

以下是示例:

df = pd.DataFrame(["Apr","May"], columns=["Month"])
mnth_to_num = {"Apr":4,"May":5}
df["Month_Num"] = df["Month"].apply(lambda x: mnth_to_num[x])

答案 2 :(得分:0)

尝试一下:

 df["datetime"] = df[["Year","Month","Date","Hour","Min","Sec"]].astype(str).agg('-'.join, axis=1)
 df["datetime"] = pd.to_datetime(df["datetime"],format="%Y-%B-%d-%H-%M-%S")