我在熊猫数据框中有以下数据。数据以50khz采样,因此每个ID组的“微秒”字段必须增加50。
数据---- ID ----微秒
0.304 ---- 1 ---- 1530348553000
0.276 ---- 1 ---- 15303485530000
0.276 ---- 1 ---- 15303485530000
0.276 ---- 2 ---- 15303490090000
0.276 ---- 2 ---- 15303490090000
0.304 ---- 2 ---- 15303490090000
0.276 ---- 3 ---- 15303553530000
1.359 ---- 3 ---- 15303753680000
1.443 ---- 3 ---- 15303753680000
需要输出
数据---- ID ----微秒
0.304 ---- 1 ---- 1530348553000
0.276 ---- 1 ---- 15303485530050
0.276 ---- 1 ---- 15303485530100
0.276 ---- 2 ---- 15303490090000
0.276 ---- 2 ---- 15303490090050
0.304 ---- 2 ---- 15303490090100
0.276 ---- 3 ---- 15303553530000
1.359 ---- 3 ---- 15303753680050
1.443 ---- 3 ---- 15303753680100
代码
import numpy as np
from itertools import chain
lens = list(map(len, df['Data'].str.split('|')))
df['microsec'] = pd.DatetimeIndex ( df['DateTime'] ).astype ( np.int64 )// 10 ** 9
df['Data'] = df['Data'].str.replace(',','.')
res = pd.DataFrame({'ID': np.repeat(df['ID'], lens),
'microsec': np.repeat(df['microsec']*10000, lens),
'Data': list(chain.from_iterable(df['Data'].str.split('|')))
})
res[['Data']] = res[['Data']].astype(float)
res.to_csv('samplefile.txt', index=False)
我尝试过的事情
df_groups = res.groupby('MeasurementID')
for MeasurementID,microsec in df_groups:
microsec = microsec*50
print(microsec)
但是我没有达到我想要的输出。请让我知道我在哪里做错了。
答案 0 :(得分:1)
我认为下面的代码应该可行。
def func(col,base):
for i in range(len(col)):
col.iloc[i]=col.iloc[i]+base
base=base+50
return col
df.groupby(['Data','ID'])['microsec'].transform(lambda x:func(x,0))