R中FF包大CSV的基本分析

时间:2013-05-27 18:04:22

标签: r

去年我一直在乱用R,现在想要更深入一点。我想了解有关ffbig data软件包的更多信息,因为在查看某些文档时遇到了麻烦。

我喜欢通过这样做来学习,所以假设我有一个名为data.csv的巨大CSV及其300 mbs。它有5个标题Url,PR,推文,喜欢,年龄。我想基于URL对列表进行重复数据删除。然后我想在散点图上绘制PR和喜欢,以查看是否存在任何相关性。我将如何进行基本分析?

我总是对大数据流程的分块以及你无法立即加载所有内容感到困惑。

使用ff包或大数据遇到的常见问题是什么? 还有另一个更好的包吗?

基本上任何开始使用R中的大量数据的信息都是有用的。

谢谢!

尼科

0 个答案:

没有答案