我正在尝试理解一些机器学习术语:参数,超参数和结构 - 所有这些都在Bayes-net上下文中使用。 1)特别是,结构如何与参数或超参数不同。 2)参数化意味着什么?感谢。
答案 0 :(得分:1)
一般情况下(但确切的定义可能因作者/论文/模型而异):
P(y|x) = 1/(1 + exp(-<x, w>))
的线性函数,其中w
是参数即可。w
是一个参数,在概率最大化期间可以学习,例如使用最速下降法(SGD)。答案 1 :(得分:1)
<强>结构强>
网络的结构或拓扑应该捕获变量之间的定性关系。特别是,如果一个节点影响或导致另一个节点,则应直接连接两个节点,其中弧指示效果的方向。
让我们考虑上面的例子,我们可能会问哪些因素会影响患者的机会 患癌症?如果答案是“污染和吸烟”,那么我们应该添加弧线 从污染和吸烟者到癌症。同样,患有癌症会影响患者 呼吸和获得正X射线结果的可能性。所以我们添加弧线 从癌症到Dyspnoea和XRay。得到的结构如上图所示。
结构术语和布局
在讨论网络结构时,使用家庭隐喻是有用的:如果从前者到后者有弧,则节点是孩子的父母。扩展隐喻,如果存在有向节点链,则一个节点是另一个节点的祖先 它出现在链的前面,而节点是另一个节点的后代 在链条的后期出现。在我们的例子中,癌症节点有两个父母,污染和吸烟者,而吸烟者是X射线和呼吸困难的祖先。同样,Xray是癌症的孩子,也是吸烟者和污染的后裔。节点X的父节点集由Parents(X)给出。
按照惯例,为了更容易目视检查BN结构,通常布置网络,使得弧通常从上到下指向。这意味着BN“树”通常被颠倒描绘,根部位于顶部,叶子位于底部!
答案 2 :(得分:-1)
要添加lejlot的答案,我想在术语“参数”上花一些时间。
对于许多算法,paratemer的同义词是weight
。大多数线性模型都是如此,其中权重是描述模型的线的系数。在这种情况下,parameters
仅用于学习算法的参数,这在移动到其他类型的ML算法时可能有点混乱。而且,与lejlot所说的相反,这些参数可能不那么抽象:通常它们对学习过程的影响具有明确的含义。例如,对于SVM,参数可能会加重错误分类的重要性。