NoSQL作为数据挖掘解决方案?

时间:2016-02-02 06:27:16

标签: data-mining olap data-analysis star-schema nosql

NoSQL数据库在数据挖掘方面比OLAP数据库更有用,或者它的用处如何?

从巨大的数据量中快速检索数据还有无模式数据库是否有优势?

1 个答案:

答案 0 :(得分:3)

关于高级查询功能

NoSQL数据库通常没用

它们专为非常原始的查询而设计,例如键值存储。

但你不能用它做很多分析。

适合数据挖掘的数据库需要允许:

  • 查找具有特定于域的相似性函数的类似记录(k个最近邻居)
  • nearest-neighbor self-joins,radius-self-joins
  • 成对比较
  • 优化数学方程式和快速矢量数学,最好是GPU卸载

原样,人们在挖掘数据库时所做的事情是ETL:

  • 通过SELECT
  • 提取他们需要的内容
  • 将其转换为所需的方案
  • 将其从数据库加载到数据挖掘应用程序

即。数据库执行ETL,但数据挖掘发生在外面