数据挖掘如何实际工作?

时间:2010-09-14 00:34:04

标签: data-mining

假设我想在超市的数据库上进行一些数据挖掘。这究竟意味着什么?

1)输出/结果会是什么样的?

2)输出每天会不同或随时间变化吗?

3)在应用数据挖掘之前,我是否需要知道我想要什么,或者数据挖掘是否会自动提供我想要的一切?

4 个答案:

答案 0 :(得分:3)

Data Mining是可以应用于不同类型数据集的一般技术类别,就像编程是可以使用不同语言应用于不同事物的一般技术类别。

你的任何问题都没有任何意义。

答案 1 :(得分:3)

A1:数据挖掘将为我们提供有关您对超市数据库查询的准确报告。

A2:当然,因为数据挖掘依赖于时间分析,在这种情况下,它取决于您想要达到的问题或目标。如果您的数据库非常大,您也可以以正确的方式构建数据仓库,随着时间的推移,您将获得不同的输出。

A3:是的,您应该确定您需要解决的问题,然后使用数据挖掘工具自动获取结果或指标。

答案 2 :(得分:1)

回答您的第一个问题:对于超市客户数据,我可以想象以下问题:

  • 星期五通常会售出多少产品X

    (帮助您确定库存中应该有多少X

  • 哪些客户经常在上个月/年购买产品X

    当您引入新的X类产品时非常有用:仅向这些客户发送广告材料(具有给定成本)。

  • 鉴于顾客购买产品X(例如啤酒),他/她还购买产品Y(例如筹码)的概率是多少?

    对以下内容非常有用:请确保XY同时不在促销优惠中(XY经常一起购买)。通过X提供折扣,让顾客进入商店,知道他们也会同时Y。或者:在X旁边放置一个价格高Y的产品,将更便宜的X放在其他地方。

  • 哪些社区拥有最少的客户?

    有助于找出您可以通过广告定位的社区,以吸引更多客户进入商店。

通常,通过“向数据提出某些问题”,可以发现一些功能并提出新问题。

答案 3 :(得分:0)

数据挖掘是一组技术。它指的是在数据中发现有趣和意想不到的模式。

如果你想应用一些数据挖掘技术,你需要知道哪一个,你应该知道为什么。问题1,2和3的答案取决于您选择的技术。

例如,如果我想在超市中销售的商品之间找到关联,我可以使用关联规则挖掘。如果我想找到类似客户的群组,我可能会使用群集算法。等。

数据挖掘中不仅有一种技术。