标签: python pandas analytics
我目前在simpledb中存储各种站点事件(展示次数,点击事件,页面部分视图等)以进行原始数据记录,我正在探索处理此数据的最佳方法。
由于pandas看起来符合这么多不同的查询方法(尚未进行深入研究),我正在考虑每天将所有记录(或增量记录)从simpledb导出到CSV文件中然后循环遍历所有csv并导入到pandas中。
csv中大约有15列,可能是数百万条记录中的10列。
这是处理分析的好方法吗?或者有人可以提出更好的选择吗?