用户提交的内容过滤

时间:2010-04-06 16:35:19

标签: algorithm filter filtering

有没有人对可以用来过滤不值得信任的用户提交内容的方法有任何想法?

以Yelp为例,他们需要阻止竞争对手在竞争对手上撰写商业评论。他们需要阻止企业主有利地审查自己的业务,或强迫朋友/家人这样做。他们需要防止质量低劣的评论影响企业评级等。

我无法想到他们可能会用它来做什么:

  • 阻止来自同一IP的多个用户审核某些内容
  • 阻止企业主审核自己的业务(甚至可能是与自己业务相同的其他业务?)
  • 以某种方式确定审核的内容以及背后的实际意图

除了第一点和第二点之外,我想不出任何聪明/简单的方法来过滤可能有害的评论,除了人类这样做。显然,对于Yelp大小的站点来说这是不可行的,那么它们可以考虑哪些参数呢?即使有人为干预,怎么会有人知道这是业主最好的伙伴在不知情的情况下撰写虚假评论?

我在一个关于自动过滤用户内容主题的大型研究中以此为例。有没有人知道这些系统如何运作以及它们考虑了什么?

谢谢!

2 个答案:

答案 0 :(得分:2)

第三个听起来完全不可能,没有计算机能够读懂用户的想法,并且在那时它仍然是对隐私的侵犯。尽管有这些原因,但人们应该根据自己想要的标准自由地审查某些内容。

我认为基于评论的网站(如IMDB或yelp)会做其他一些事情:

  1. 要求用户在评分真正计入任何内容之前,要么对这么多项目进行评级,要么成为会员。

  2. 希望评论的数量足够高,以便任何极端的一些异常值都不会影响平均值。您可以考虑使用与纯平均值不同的算法来计算最终得分 - 也许使用中位数。

答案 1 :(得分:2)

我会让Zachary无法真正阻止人们因任何特殊原因发布内容。

最好的事情是期望有一些糟糕或狡猾的评论,一些垃圾邮件,一些白痴试图破坏我们其他人,但也有大多数人是善意的。 Stack Overflow建立在这些想法之上。所以:

  1. 保留一个IP地址字典,并给每个人分级。限制给定IP可以发布多个评论的频率,如果他们试图泛滥系统,则禁止IP一段时间。这样,他们表现得越差,对他们来说就越难。
  2. 让网站的用户对每次评论进行评分 - 亚马逊会这样做'这篇评论对此有用吗?'。
  3. 除了2.,保持每个用户(公开或私下)的得分,如SO信誉得分,并用它来限制新用户或行为不当的用户的行为。如果您的声誉太低,则无法对其他人的评价进行评分。 Slashdot允许您选择是否过滤掉低得分的回复。
  4. 让企业在一个特殊的评论中提出他们的一面,这个评论位于列表的顶部(并将其标记为这样),以便他们可以在某处说出他们必须说的所有漏洞。
  5. 注意惩罚和奖励行为的原则,而不是人。这样,轻微行为不端的人可以得到纠正,转而成为富有成效的贡献者,因为无论如何他们经常会受到关注。
  6. 在列表底部隐藏低评分,就像SO命令答案一样。这样一来,寻求注意力的冲动会促使用户产生高质量的评论,而不是发布FAKE !!!! 11 !!
  7. 阅读Jeff Atwood的Coding Horror博客;并按顺序收听SO播客条目。那里有一个经验丰富的矿井。