问题:查找对象的估计生命周期(例如,下次写入的时间)或相应的PDF。这称为renewal process。
约束:跟踪每个对象的元数据是不可行的
假设:允许低容量对象的预测误差,但随着对象的日益普及,不准确性会降低
您是否有任何想法可以通过sketch data structures(Bloom过滤器,Count-min草图等)或采样形式(例如exponentially-biased reservoir sampling)来实现这些预测?假设一个特定的随机过程(例如泊松过程)会使问题更容易解决吗?
这个问题的一个色彩缤纷的例子是:估计用户下次访问您的网站/点击某些内容时,无法跟踪每个用户的历史记录。