如何确保通过众包收集的数据的正确性?

时间:2009-04-24 10:01:37

标签: crowdsourcing

我有一个网站,用户输入他们购买的某些产品的数据。

如何确保通过众包(使用户能够投票/编辑产品)输入的数据的正确性,从而最大限度地减少管理员需要完成的工作量?我正在寻找一些方法,最佳实践等。

3 个答案:

答案 0 :(得分:2)

您收集的是哪种数据?

你在谈论众包,因此(我假设)聚集了这群人的数据。当他们谈论他们购买的产品时,我怀疑你将会提供产品属性和价格。

一些可能的方法。如果用户输入的是非数字数据(例如颜色),则只记录最常见的条目或模式(最常输入的)。

如果他们输入数字数据,则丢弃异常值。也就是最低和最高的结果,以及其他的平均值(你可以这样做,比如说。这是电子交易所用来解决许多交易中的收盘价的方法)。

根据您的应用程序,您可能希望对最近的条目有历史偏见。

但这完全取决于您的应用程序,以及您准备做多少存储和处理数据。

答案 1 :(得分:1)

确保每次操作都保留IP地址日志,恶意用户或机器人会抓取会话数据或Cookie。这样做可以确保单个实体不会因​​为多个用户而倾斜任何结果或做任何激烈的事情。

答案 2 :(得分:0)

由于可以从“人群”收集具有相关正确性值的高级数据。看看SO,来自拥有1000多名代表的人的答案或回应,更加明显是一个随意的用户。寻找验证和三角测量,如果它是你正在听的人群中的一个声音,那么它可能不值那么多。如果其他声音加入,那么你就知道自己正在做某些事情,再次以SO术语,我们都有机会提出问题。

我最近看到一些非常好的iPhone应用程序依赖众包来获取数据,然后通过询问其他用户是否正确来验证它。