我一直在尝试使用不同的方法来确定LDA中的主题数量(在R中),并使用方法Gibbs采样使用R包ldatuning
,但无法理解不同指标的含义,如:
metrics = c("Griffiths2004", "CaoJuan2009", "Arun2010", "Deveaud2014"),
method = "Gibbs",
有人可以帮我理解不同的指标吗? 如果有人能在这里提供一些很好的指导。 在此先感谢。
答案 0 :(得分:0)
你看过FindTopicsNumber_plot()吗?尝试:
FindTopicsNumber_plot(your_result_from_tuning)
每个指标都有不同的优缺点,并且根据您的数据细节,可能会或多或少地适用。但基本的概述是你想要最小化Arun和CaoJuan的参数,但是你需要最大化Griffiths和Deveaud的参数。