我在python中看到了一些关于Quering JSON的问题,但我找不到我想要的东西。 我有两个JSON格式的大文件,其中每一行都是一个记录,例如
文件1:
{"x": 2, "y": 0}
{"x": 3, "y": 1}
{"x": 4, "y": 1}
文件2:
{"x": 5, "z": 0}
{"x": 4, "z": 1}
{"x": 4, "z": 1}
我用
将文件输入到pythonfor line in infile:
Review = json.loads(line)
在将该行插入“review”之后,我会执行额外操作以将这些记录插入到dict中。
这需要相当长的时间,因为每个文件都有大约100K行。 现在,如果我想查询这些文件(假设,通过X加入),我必须再次遍历它们。我想在python中使用某种Sqlite包来做这件事,但它看起来太笨拙了。 任何人都知道最有效的方法是什么? 感谢。
答案 0 :(得分:1)
SQLite3在python标准库中,所以你已经拥有它了。您可以使用(“:memory:”)在内存中创建表,而不是普通的连接字符串(上面链接的页面上的详细信息)。
您正在对大量内容执行数据库样式操作,并且您希望快速执行这些操作:这表明(a)数据库和(b)将所有内容加载到内存中。