我有一个经常执行数据挖掘操作的数据集。我想基于数据更新的频率来执行数据挖掘操作的频率。是否有任何方程式可以根据数据更新频率给出最佳挖掘频率?如果没有,我想得到自己的,我该怎么做呢?如果我想包含更多变量怎么办?如果有任何可用的话,我只需要一些阅读材料的指示。谢谢。
答案 0 :(得分:0)
这不是一个真正的CS问题,即使它听起来像一个(除非它是一个家庭作业问题......我会假设你有一个现实世界的问题需要解决)。我假设如果您是“数据挖掘”,那么您所做的不仅仅是针对实时OLTP数据库运行查询(例如在单独的系统上设置多维数据集)。它将归结为用户问题。答案将取决于:
答案可能不是你可以“衍生出来的”。它将来自两端用户(自动或人工)的限制。
答案 1 :(得分:0)
不确切知道您的数据是什么样的,或者您的需求是什么 - 通常我们数据到
如果
,你只需要进一步的数据就公式而言,没有,但我会引用您关于Statistical Significance的维基百科文章。