Scala中数据框架的ANOVA模型(测试)

时间:2017-04-09 18:27:39

标签: scala dataframe anova

我在Scala中有一个包含两列的数据框(Y是连续的,X是分类的(A到J))。我需要对此数据框架执行ANOVA测试,我想知道您是否可以为我提供执行此测试的必要步骤? 我试图在线找到解决方案,我遇到了以下链接: https://gist.github.com/srnghn/c74835818802fefabd76f1bcd6746831/revisions 但是,由于我是Scala的新手,我无法弄清楚如何在我的数据框中的代码中运行ANOVA函数? 非常感谢你提前!!

1 个答案:

答案 0 :(得分:0)

如果您想运行该代码,只需将数据映射到Dataset[CatTuple],然后使用该数据集调用getAnovaStats函数。

更多细节(这是一个如何创建数据集的示例,您应该将数据转换为此格式):

final case class CatTuple(cat: String, value: Double)
val data = Seq(CatTuple("a",1.0), CatTuple("b",1.0), CatTuple("a",1.5)).toDS() 
val anovaStats = getAnovaStats(data)