假设我想在超市的数据库上进行一些数据挖掘。这究竟意味着什么?
1)输出/结果会是什么样的?
2)输出每天会不同或随时间变化吗?
3)在应用数据挖掘之前,我是否需要知道我想要什么,或者数据挖掘是否会自动提供我想要的一切?
答案 0 :(得分:3)
Data Mining是可以应用于不同类型数据集的一般技术类别,就像编程是可以使用不同语言应用于不同事物的一般技术类别。
你的任何问题都没有任何意义。
答案 1 :(得分:3)
A2:当然,因为数据挖掘依赖于时间分析,在这种情况下,它取决于您想要达到的问题或目标。如果您的数据库非常大,您也可以以正确的方式构建数据仓库,随着时间的推移,您将获得不同的输出。
A3:是的,您应该确定您需要解决的问题,然后使用数据挖掘工具自动获取结果或指标。
答案 2 :(得分:1)
回答您的第一个问题:对于超市客户数据,我可以想象以下问题:
星期五通常会售出多少产品X
?
(帮助您确定库存中应该有多少X
)
哪些客户经常在上个月/年购买产品X
?
当您引入新的X
类产品时非常有用:仅向这些客户发送广告材料(具有给定成本)。
鉴于顾客购买产品X
(例如啤酒),他/她还购买产品Y
(例如筹码)的概率是多少?
对以下内容非常有用:请确保X
和Y
同时不在促销优惠中(X
和Y
经常一起购买)。通过X
提供折扣,让顾客进入商店,知道他们也会同时Y
。或者:在X
旁边放置一个价格高Y
的产品,将更便宜的X
放在其他地方。
哪些社区拥有最少的客户?
有助于找出您可以通过广告定位的社区,以吸引更多客户进入商店。
通常,通过“向数据提出某些问题”,可以发现一些功能并提出新问题。
答案 3 :(得分:0)
数据挖掘是一组技术。它指的是在数据中发现有趣和意想不到的模式。
如果你想应用一些数据挖掘技术,你需要知道哪一个,你应该知道为什么。问题1,2和3的答案取决于您选择的技术。
例如,如果我想在超市中销售的商品之间找到关联,我可以使用关联规则挖掘。如果我想找到类似客户的群组,我可能会使用群集算法。等。
数据挖掘中不仅有一种技术。