最近,我收到了海外家人的朋友建议 - 但事情就是这样。我没有使用facebook的家庭成员,我们没有共同的名字,我们甚至不在同一个大陆。事实上,我已经十多年没有与他们沟通了。
然而,Facebook知道他们,并知道他们可能是一个很好的建议。我的问题是从数据的角度来看,Facebook在哪里获取这些信息?
我不关心隐私,而是涉及技术方面。是否有一个时髦的算法,使它全部工作?或者Facebook正在利用我不知道的关于我的信息?
答案 0 :(得分:3)
我最近做了一个实验,如果我有一个人的全名和IP地址,我可以知道那个人是谁?他/她住在哪里?他们去哪所学校和其他公共信息。
这样的设施可以很容易地编程(许多人已经尝试过)。这样想 - 我知道一个人的姓氏和位置。现在,我可以追踪具有相同姓氏并居住在同一地区的所有人。通过这种方式,我可以拥有一个简单的家谱图社交图。匹配更多细节,我可以更好地了解这些人分享的“关系”。 (尝试一下)。
我甚至无法想象2亿强大社交网络可以产生的数据量。我想他们这样做 - a)A,B,C和D有4个人。'A'有'B'和'C'的电子邮件,但没有'D'的电子邮件。 'B'和'C'都有'D'的电子邮件。现在我可以说A知道D的几率为60%。
b)'A'访问了'D'的个人资料。这是它们之间的连接 - A-> B-> C-> D。现在,还有一个人'E'直接连接到A和D.所以短链 - > A-> E-> d。 通过这3条信息,我可以有70%的机会A知道D.在这种情况下,'D'没有做任何事情,并得到了朋友的建议。
所以我认为生成社交图非常容易,只需要一些有用的数据和一些动力。
答案 1 :(得分:2)
http://blogoscoped.com/archive/2009-06-12-n15.html
http://consumerist.com/5301425/facebook-where-are-you-getting-these-crazy-friend-suggestions-from
答案 2 :(得分:1)
Facebook使用在您的个人资料,联系人列表,消息,直接评论,页面访问,共同朋友,工作场所/居住地附近输入的信息。基本上一个人一直在做的互动。此信息被转储到日志或大型列表中,这是一个大数据。 fb页面的每个组件都可以创建进入的部分。分析这些巨大的数据以寻找可能的匹配。每个因素都给出了一个权重,比如对某人页面的直接评论是一个很大的分数。因此,Terra Byte系列的所有这些数据都被Facebook集群上的Hadoop Map Reduce所搅动,然后结果被Web服务消费。这些Web服务向用户显示数据/可能将其放在传统的数据库中,如MySql。如果您通过电子邮件等联系信息,那么它们也会被分析。
答案 3 :(得分:0)
在我看来,存在一种可能性,在这种情况下,你被建议的朋友没有明显的联系,这就像提问者所要求的那样。那是当其他人使用“朋友查找器”搜索您的个人资料时。这样,用于建议朋友的算法获得新朋友建议的线索给已经搜索了其简档的人。