我有一个单词和单词频率的文本文件。它非常大 - 理论上我们说的是数百万行。
我只想从文件中检索值,并尽可能快速有效地执行(对于Web应用程序,在Django中)。
我的问题是:存储和检索值的最佳方法是什么?应该将它们导入SQL吗?或者保留文件并使用grep?或者将它们放入JSON字典......?或者其他一些方式?
非常感谢您的建议!
答案 0 :(得分:2)
将它们放在json字典中是一个坏主意,除非你想在搜索它时将整个内容加载到内存中。
sql基本上是为这种东西而构建的,所以我会用它。一个文件和grep也可以正常工作,但是你不会从sql给你的索引等方面获得任何好处。