我有两个类似的时间序列:
timestmap1, user, item
timestamp_other, user, item
并以每个用户一定的容忍度执行https://pandas.pydata.org/pandas-docs/stable/generated/pandas.merge_asof.html asof合并,即使用用户上的by
标志。
结果有点类似于:
df = pd.DataFrame({'left_ts':[1,2,3,4], 'right_ts':[1,3,3,4]})
但是,如果时间序列连接在语义上是正确的,我希望该项目也相同。通过添加其他列进行检查:
df['is_different'] = df.left_ts != df.right_ts
现在,当我想调试它并查看更大或更小的容限是否会带来更好的结果时,如何将任何记录打印到不匹配的屏幕上,也就是在前/后5行。 不幸的是,完整df太长而无法显示/右侧包含太多空值。