如何解释限制玻尔兹曼机器的训练过程?

时间:2016-04-24 16:01:22

标签: machine-learning

我最近正在研究受限制的玻尔兹曼机器(RBM)。

我研究过G. Hinton的论文:    https://www.cs.toronto.edu/~hinton/absps/guideTR.pdf

在RBM中训练图像是为了提高概率"网络的数据,但我无法解释为什么这有意义:我们如何用给定的图像训练网络是为了提高它的网络概率

有人可以解释一下吗?谢谢。

1 个答案:

答案 0 :(得分:2)

将RBM视为一个能够生成东西的黑盒子。让我们专注于图像领域 - 它现在是一个能够生成任何类型图像的黑盒子 - 显然大多数图像都不代表任何东西,它们只是普通的噪音。在训练期间,您将以这样的方式拟合RBM的内部参数(其定义它如何生成事物),即给定的一组训练图像具有很高的生成概率。换句话说 - 您正在以这种方式更改RBM的参数,RBM开始生成您选择的图像。怎么能在实践中完成?通过优化程序。 RBM被定义为一组权重(因此,浮点数的常数,以特定方式相互作用),因此您可以构成优化问题

npm list -prod -depth 0

在您的训练样本x上,其中theta是您的RBM权重集。有许多方法可以解决优化问题,有些使用梯度方法,还有一些其他更专业的技术。他们都有共同的目标 - 以这种方式改变初始theta(通常是随机的),它表现得“以你想要的方式”。因此,基于梯度的方法将尝试分析计算要改变的权重,以使您的优化标准(此处 - 概率)更高一些。它没有“解决”问题 - 它通常只是迭代地越来越接近实际的解决方案。