我有一个问题要问Mallet主题建模。它如何设置LDA的默认超参数,即alpha和beta?
答案 0 :(得分:0)
alpha
的默认值为5.0除以主题数。您可以将此视为关于主题均匀分布的五个“伪词”。如果文件很短,我们希望更接近制服。如果文件很长,我们会更加自信地离开先前的文件。
通过超参数优化,每个主题的beta
值可以不同。它们通常会小于默认设置。
position = pg.math.Vector2(100, 200)
velocity = pg.math.Vector2(8, 0).rotate(random.randrange(360))
的默认值为0.01。这意味着每个主题在统一先验上的权重等于词汇量的大小除以100.这似乎是一个很好的价值。启用优化后,该值很少会变化超过两倍。