我在Scala中有一个包含两列的数据框(Y是连续的,X是分类的(A到J))。我需要对此数据框架执行ANOVA测试,我想知道您是否可以为我提供执行此测试的必要步骤? 我试图在线找到解决方案,我遇到了以下链接: https://gist.github.com/srnghn/c74835818802fefabd76f1bcd6746831/revisions 但是,由于我是Scala的新手,我无法弄清楚如何在我的数据框中的代码中运行ANOVA函数? 非常感谢你提前!!
答案 0 :(得分:0)
如果您想运行该代码,只需将数据映射到Dataset[CatTuple]
,然后使用该数据集调用getAnovaStats
函数。
更多细节(这是一个如何创建数据集的示例,您应该将数据转换为此格式):
final case class CatTuple(cat: String, value: Double)
val data = Seq(CatTuple("a",1.0), CatTuple("b",1.0), CatTuple("a",1.5)).toDS()
val anovaStats = getAnovaStats(data)