标签: string indexing bigdata
假设我们有一些对象(例如字符串)。众所周知,使用索引(即数字1,2,3 ......)比使用任意对象更方便。
是否有为每个对象分配索引的常用方法?可以创建一个hash_map并在值中存储索引,但是当对象数量太高而无法放入内存时,这将是内存昂贵的。
感谢。
答案 0 :(得分:0)
您可以将字符串对象存储在已排序的文件中。 这样,您就不会将对象存储在内存中。
您的映射功能可以在已排序的文件中搜索所需的对象。 您可以创建哈希映射以优化搜索。