我的数据集中有21个不同的调查部分的开始时间和结束时间。我想计算每个调查的结束时间和开始时间之间的差异,并将这些数据放在调查专栏中。
开始时间和结束时间是HH:MM:SS
这是我的实施:
def getSec(s):
l = s.split(':')
return int(l[0]) * 3600 + int(l[1]) * 60 + int(l[2])
...将csv导入dataFrame后,我做了
timeDifferences = {}
sections =['1','2','3','4','5','6','7_1','7_2','7_3','8_1','8_2','8_3','9_1','9_2','9_3','11_1','11_2','12','15','16','17','18_1','18_2','19','21']
for i in sections:
timeDifferences["s"+i+"_time"] = (getSec(df["s"+i+"_etimestamp"]) - getSec(df["s"+i+"_stimestamp"]))* 60
问题是我在整个系列上做getSec,而不是单个数据集。我是Pandas的新手,所以我无法概念化如何同时处理整个阵列。
如果没有三个嵌套的for循环,我将如何做到这一点?