Vowpal Wabbit是一款在线学习工具。数据点到达流中,并相应地更新模型以适合标签。我有一个问题,是否可以忘掉单个数据点?想象一下,消耗了一个数据点,我想“忘掉”"它立即出于某种原因。原则上是否可以使用Vowpal Wabbit中的Logistic回归等在线学习算法?
答案 0 :(得分:2)
此类功能尚未在大众实施。您可以尝试使用1
12
123
1234
12345
123456
1234567
12345678
123456789
和-f --save_resume
标志来解决此问题,以便在某个时间点存储\还原模型状态,但效率很低。
在c ++代码中可以进行一些调整以实现这样的功能,但是它们高度依赖于您使用的训练算法,使示例不受欢迎的标准以及何时可以应用此标准。例如,我使用GD算法玩了一次,在学习(一段时间后)一些基于当前模型在其分类中的确定性的示例时忽略了它。换句话说:不要从你不确定的例子中学习。因此,我可以决定在算法接收它的同一点是否不需要示例,并且它很容易实现。
如果您正在训练二元分类器并且能够确定该示例不值得接受更快的训练那么一些元参数(如-i
)会显着改变情况然后您可以尝试提供您的模型相同标签的相同示例。这可能接近真实" unlearning"足够好,可能不会。但绝对不会等于真正的" unlearning"。我还是会在搞乱大众源代码之前尝试一下。