是否可以读取Sphinx二进制索引?

时间:2015-07-28 10:37:35

标签: binary sphinx

我通过ECB和base64加密了mysql表。搜索大数据会变得过热,所以我想一下Sphinx。我可以构建索引并将所有查询传递给Sphinx,但是读取(窃取和读取)Sphinx索引是真的吗?

1 个答案:

答案 0 :(得分:2)

好的sphinx是开源的,所以索引格式很容易获得。实际上有一个indextool二进制文件,可以显示文件中的大部分数据。 (但当然如果有人可以获取索引文件,他们可以将它们加载到sphinx的另一个副本中,然后就这样“读取”它们

...但狮身人面像的指数有些有损。它们不存储正在编制索引的原始文本字段。它被转换为倒排索引。

然后有两种类型的索引....

使用dict=keywords索引,关键字列表存储在索引中(经charset_table转换后) 因此,虽然可以重建文档文本的基础,但不是精确再现,标点符号等都会丢失。

然而,如果你使用dict=crc索引,那么实际的单词不会存储在索引中 - 只有crc32 / fnv64单词的哈希值。因此重建原始文本会更加困难。

... 因此,虽然它不是真正的加密,但是散列过程使得很难恢复数据(与密码通常存储的方式相同)

(但是,属性不同,它们按原样存储在索引中。它们很容易提取)