我正在使用大型数据集,并希望对月度数据运行logit回归。为此我创建了一个DataFrame并使用Julia中的GLM包。 我的代码喜欢这样的东西:
f=glm((Y ~ Age + Duration + Gender + Nationality + MonthIn), Data2000, Binomial(), LogitLink())
我的问题是,因为我有月度数据,我想在12个月内创建虚拟变量,或者当我想使用常量时创建11个虚拟变量。 MonthIn只是一个包含月份数字的列(例如3月3日)。我不想对此进行回归,只是将其包括在内以便更容易解释。
现在,当我试图找到这是如何完成的时候,我刚刚在R中了解到这种可能性,因为它构建了一些回归方法s.t.它可以自动创建每月假人。我认为,这不是朱莉娅的情况。 现在我猜测我将使用dataframe.jl中的池化数据函数来创建一个指标矩阵,但我不确定这样或类似的东西是如何完成的。或者只是如何手工制作假人。
我非常感谢您的帮助,请随时询问我的问题是否不清楚。
干杯
PS:从这个问题我知道我必须创建一个汇集数据阵列,但我不确定它是如何完成的。 Dummy Variables in Julia