我想猜测事件何时将在数据集中再次发生。
例如:单击电影编号3。我想确定再次单击该电影的时间戳。你能告诉我你有什么想法或代码吗?
谢谢。
答案 0 :(得分:0)
简化流程,在每个步骤中以个人身份查找所需的信息。
例如,在确定模式之前需要多少历史时间戳记?
使用exponential distribution对事件之间的时间进行建模是很常见的,因此,您需要的是一种从收集的数据中确定可能的λ参数的方法。它不是一个python问题,而是一个建模/数学问题。
“点击”之间的平均时间称为期望值,通常表示为1 /λ。因此,一旦计算了两次点击之间的平均时间,您就可以使用一些基本的代数,得出适当的λ值,以插入指数分布。
但是,如果您已经计算出两次点击之间的平均时间,则您已经知道下一次点击的最有可能的时间! (假设您将其建模为一个随机过程-如果您具有更深入的知识,则需要一个更复杂的模型)
对于值列表,在python中获取平均值的方法是:
average = sum(list) / len(list)
但是在将数据放入列表之前,您需要将数据转换为一系列time-between-clicks
间隔。