我正在尝试复制Kosinski, Stillwell, & Graepel (2013) study关于预测来自Facebook的私人特征和属性,例如用于学习目的的数据。首先,我承认,我是数据科学的新手,并在R中建立预测模型。
我的数据:
我的目标是预测用户喜欢的SOP2分数。 Kosinski等。描述他们在this graphic建立的模型。到目前为止,我已经使用irlab R软件包完成了一个SVD:
Comps.likes <- irlba(Likes.matrix, nu = 100, nv = 100)
这就是我被困住的地方..怎么从这里继续?
从我的假设我应该得到这样的东西:
fit <- lm(SOP2 ~ Comps.likes$d, data = someDataFrame)
或使用插入符号包的等效物。
我想弄清楚:
有关进一步资源的任何帮助或提示吗?