如何从稀疏矩阵到线性回归模型(使用SVD)?

时间:2015-07-10 06:38:06

标签: r regression prediction svd

我正在尝试复制Kosinski, Stillwell, & Graepel (2013) study关于预测来自Facebook的私人特征和属性,例如用于学习目的的数据。首先,我承认,我是数据科学的新手,并在R中建立预测模型。

我的数据:

  1. 一个稀疏矩阵(dim 237 x 43232),包含237个用户,如果他们喜欢43232个fb页面中的一个(由1表示喜欢,0表示不喜欢)。行名包含user.ids。
  2. 包含user.ids,年龄,性别和多个调查分数的列的data.frame,对于此示例,我们可以获取SOP2分数(乐观 - 悲观分数)。
  3. 我的目标是预测用户喜欢的SOP2分数。 Kosinski等。描述他们在this graphic建立的模型。到目前为止,我已经使用irlab R软件包完成了一个SVD:

    Comps.likes <- irlba(Likes.matrix, nu = 100, nv = 100)
    

    这就是我被困住的地方..怎么从这里继续?

    从我的假设我应该得到这样的东西:

    fit <- lm(SOP2 ~ Comps.likes$d, data = someDataFrame)
    

    或使用插入符号包的等效物。

    我想弄清楚:

    1. 缺少的步骤是如何从Comps.likes(SVD步骤)到 回归公式,每个Facebook都有一个系数 预测SOP2。
    2. 从用户向量实际预测SOP2的步骤 喜欢per user.id。
    3. 有关进一步资源的任何帮助或提示吗?

0 个答案:

没有答案