一般策略:Python中的数据/数组分析

时间:2013-07-17 17:38:30

标签: python arrays pandas data-analysis

这是一个战略问题。

我刚刚在VBA和SQL中完成了一项任务,我不知道如何在Python中执行,因为我只是在学习,并且对Python中的常规方法感兴趣。

我有三个表/矩阵/数组。

名称和ID:

Name   NID
Amy    1
Becky  2
Cathy  3
Dana   4

具有关联名称和日期的对象:

OID   Names       Date
1a    Amy, Cathy  3/1/2012
2x    Dana        3/1/2011
4s    Amy, Becky  3/1/2010

与NID相关的日期范围:

NID   Start     End
3     1/1/2012  1/1/2013

我想要回答的问题是:对于最后一个矩阵中的每个NID,哪些OID是相关的(即名称出现在对象中,日期落在最终矩阵中为该名称给出的日期范围内)?

这是一个广泛的问题,但如果可能的话,在python中执行这种任务会很欣喜若狂。请注意,只有1个和多达1,000个不同的名称可以与OID协助。

1 个答案:

答案 0 :(得分:3)

为什么不将这些数据保存在SQL数据库中? SQL非常适合处理您想要执行的操作,并且您似乎已经熟悉它。这样做还具有可移植性的附加优势,因此您可以在VBA和Python之间切换,而无需移植大量代码。

对于MySQL,我建议您查看MySQLdb模块。您可以在此处查看official documentation,我建议您查看this更加用户友好的教程。

如果您想在不设置MySQL服务器的情况下进行快速原型设计,则可以使用SQLite。在这种情况下,我会查看sqlite3模块的documentation