标签: python hdf5 h5py pytables
我有一个嵌入数据集,我想将其存储在hdf5文件中。
对于这个数据集,我想对给定的嵌入进行相似性搜索。我想知道如何使用Pytables或H5py在Python中执行此操作?
嵌入相似性搜索基本上是将给定嵌入的点积与数据库中的每个嵌入相乘,然后返回给出最高点积得分的前k个嵌入。