我有一个大约5M行的csv文件数据库,其中包含以下字段
start_ip,end_ip,country,city,lat,long
我将这些存储在LevelDB中,使用start_ip作为键,并将其作为值。
如何检索
中的键的记录( ip_key > start_ip and ip_key < end_ip )
任何替代解决方案。
答案 0 :(得分:2)
我假设您的密钥是IP的哈希值,哈希是64位“无符号”整数,但如果不是这样,那么只需修改下面的代码即可考虑正确的密钥。
void MyClass::ReadRecordRange(const uint64 startRange, const uint64 endRange)
{
// Get the start slice and the end slice
leveldb::Slice startSlice(static_cast<const char*>(static_cast<const void*>(&startRange)), sizeof(startRange));
leveldb::Slice endSlice(static_cast<const char*>(static_cast<const void*>(&endRange)), sizeof(endRange));
// Get a database iterator
shared_ptr<leveldb::Iterator> dbIter(_database->NewIterator(leveldb::ReadOptions()));
// Possible optimization suggested by Google engineers
// for critical loops. Reduces memory thrash.
for(dbIter->Seek(startSlice); dbIter->Valid() && _options.comparator->Compare(dbIter->key(), endSlice)<=0); dbIter->Next())
{
// get the key
dbIter->key().data();
// get the value
dbIter->value().data();
// TODO do whatever you need to do with the key/value you read
}
}
请注意,_options
与您用于打开数据库实例的leveldb::Options
相同。您希望使用选项中指定的比较器,以便您读取记录的顺序与数据库中的顺序相同。
如果您没有使用boost或tr1,那么您可以使用与shared_ptr
类似的其他内容,也可以自行删除leveldb::Iterator
。如果你不删除迭代器,那么你将泄漏内存并在调试模式下获得断言。