我正在寻找
的好参考使用Clojure进行大规模数据挖掘
我知道许多优秀的编程书籍(编程Clojure,欢乐的Clojure,......),以及许多优秀的数据挖掘教科书(挖掘海量数据集,管理千兆字节......)。但是我不知道有任何专门针对
的参考文献使用Clojure进行大规模数据挖掘
“with clojure”部分对我来说非常重要,原因如下:
* most theoretical analysis uses big-Oh running time, which ignores constants
* constants matter, if it ends up being a matter of 1 second vs 1 hour (for things that need to be real time)
* or 1 hour vs 1 week (for batch jobs)
特别是,我认为JVM,Clojure数据结构之间存在很多相互作用,数据是存储在内存中还是懒惰地从磁盘读取 - 可以使“相同”算法的运行时间大不相同“ “不同的实施。
因此,我的问题(以上所有内容都是为了避免被“Check Google”关闭):
使用Clojure进行海量数据挖掘的好资源是什么?
谢谢!
答案 0 :(得分:13)
我认为没有人写过一篇很好的综合参考资料。但是在这个领域肯定有很多工作要做(包括我自己的公司!)
一些有趣的跟进链接:
答案 1 :(得分:1)
2013年5月出版了一本精彩的书: Clojure数据分析手册。我可能会买它。
详细信息
数据无处不在,能够获得越来越重要 我们可以采取行动的见解。使用Clojure进行数据分析和 收藏,这本书将告诉你如何获得新的见解和 来自您的数据的视角与实用的基本集合, 结构化食谱。
“Clojure数据分析手册”介绍了每个阶段的食谱 数据分析过程。是否从网页上抓取数据, 本书具有执行数据挖掘或为Web创建图形的功能 适合手头的任务。
您将学习如何获取数据,清理数据并将其转换为数据 有用的图表,然后可以分析和发布到 互联网。覆盖范围包括处理数据等高级主题 同时,应用贝叶斯等强大的统计技术 建模,甚至数据挖掘算法,如K均值聚类, 神经网络和关联规则。
方法
完整的实用技巧,“Clojure数据分析手册”将有所帮助 您可以通过一系列一步一步的真实来充分利用您的数据 世界食谱涵盖数据分析的各个方面。
本书适用于谁
以前使用Clojure和数据分析技术的经验 工作流程将是有益的,但不是必需的。