我收到了一些包含数据的TSV文件,在几个文件中总共大约800MB。 它们中的每一个都有与另一个文件中的列相链接的列。
到目前为止,我已将所有数据导入Python并将其存储在数组中。我现在需要找到一种方法来建立数据库,而不使用任何SQL,NoSQL等。
最后,我将在其上执行类似SQL的查询(不使用SQL)并对数据执行OLAP操作。我也不能使用任何外部库。
在做了一些研究后,我发现使用字典作为这个项目的一种方式,但我不知道如何将表格与字典链接起来。它会是一个词典列表吗?
答案 0 :(得分:1)
是的,您可以使用嵌套的dict结构伪造大量数据库操作。顶级是你的“表”,每个表都有条目(在这些表上使用“主键”),每个条目都是键的值:值对,其中键是“列名”,值是,值,值。
如果你愿意的话,你甚至可以在这上面写一些类似sql的查询语言,但是你想先写一些代码来管理它。您不希望徒手构建此DB,将操作定义为代码非常重要。例如,insert应该处理强制值限制和强加默认值以及设置自动递增键等等(如果你真的想要“对它执行类似sql的查询”)