机器学习如何利用Facebook对用户的兴趣做出决定

时间:2012-04-20 16:26:47

标签: machine-learning

我正在试图找出一种可以将Facebook用户表示为向量的方法。我决定将用户的不同属性/参数堆叠成一个大向量(即年龄是一个大小为100的向量,其中100是你可以拥有的最大年龄,如果你可以说50,前50个值是矢量将像温度计一样1。我只是无法找到一种方法来表示Facebook作为一个矢量的兴趣,它们是一个单词的集合,代表所有单词的空间是巨大的,我不能去像一个单词或一袋字的模型相似的东西。有谁知道我该怎么办?我还是新手,任何参考都会受到高度赞赏。

如果想要对这个问题进行投票,请让我知道它有什么问题,以便我可以改进措辞和背景。

由于

1 个答案:

答案 0 :(得分:2)

“正确”的方法取决于您的学习算法是什么以及决策问题是什么。

但是,将年龄表示为单个数字特征而不是100个指标特征通常会更好。这样学习算法就不必学习那百个特征之间的关系(它已经被烘焙),而且问题的尺寸减少了99个,这将使一切变得更好。

为了模拟兴趣,你可能想要从一个非常高维度的词袋模型开始,然后使用各种选项之一来减少维度: