我是深度学习领域的新手,我想问一下使用自动编码器进行异常检测的未标记数据集。我令人困惑的部分从以下几个问题开始:
1)一些帖子说与原始数据集分离异常和非异常(假设已标记),并使用唯一的非异常数据集训练AE(通常,非异常的数量将更为占优势)。所以,问题是如果没有标签,我该如何分离我的数据集?
2)如果我使用原始的未标记数据集进行训练,如何检测异常数据?
答案 0 :(得分:0)
数据标签不会进入自动编码器。
自动编码器由两部分组成 编码器和解码器
$route = Http\Literal::factory(array(
'route' => '/nice-looking-url',
'defaults' => array(
'controller' => 'Application\Controller\Nicelookingurl',
'action' => 'index'
),
));
$router->addRoute('nicelookingurl', $route, null);
:对输入数据进行编码,比如说具有784个特征到50个特征的样本
Encoder
:从这50个功能中将其转换回原始功能,即784个功能。
现在可以检测异常,
如果您通过Decoder
,则应将其转换回其unknown sample
,而无需过多original sample
。
但是如果有loss
转换回来。那么它可能是lot of error
。