我最近了解了自动编码器,并计划构建一个用作具有隐式反馈的推荐系统的一部分。
基于经典自动编码器的工作原理,似乎它们可用于重建其成分不一定为0或1的向量。但是,所有介绍材料似乎都表明自动编码器在二进制向量上运行, x = [0,1] ^ d,如here或此paper中的第2.2节。
为了将非自动编码器用于非二进制向量,在我看来,唯一的区别是应该使用L2错误函数而不是适用于二进制情况的crossentropy。
如果有人能为我澄清这一点,我感激不尽。
答案 0 :(得分:3)
你混淆了符号
x e [0, 1]^d
表示“x属于作为d维单位超立方体的空间”。要说“x是长度为d的二进制向量”,你可以写
x e {0, 1}^d
注意不同的括号。 [0, 1]
是一个区间,而不是一组2个元素。
因此没有人声称自动编码器需要二进制输入,它不,它在整个R ^ d空间中定义(但由于各种原因,它更容易从一些有限的子集开始工作,因此[0,1]超立方体,我们有很好的启发式启发式算法)。