我想在文件系统上存储超过1亿个字符串。与字符串(~255Chars utf8)一起,将有两个日期和一些定义其属性的整数值。
我可以将它们放在CSV文件中,但它会很大。我可以在子目录中放置几个较小的CSV文件以使其更快,或者我可以简单地为每个字符串创建一个文件并将它们存储在目录树中。
我如何知道哪种解决方案更快更容易保持/开发?我甚至不知道我的弦是多么稀疏;也许我有50万个以相同的字符开头,从而使树不那么平衡。
现在我想我可能会创建一个包含前5个字符的目录结构,然后将csv文件放在每个目录中。例如。字符串“我不知道我在做什么” - > “Idontknowwhatimdoing”进入
/i/d/o/n/t/list.csv
有什么好主意吗?我不能使用Db.I使用java来存储和php来读取文件系统,如果这有什么不同。