在我当前的应用程序中,我需要创建一个基于案例的存储库 基于实例的学习范例在AI社区中众所周知。
需要在两次调用之间持久存储基于案例的存储库 应用程序。
但是我担心这会暗示序列化/反序列化 (可能是JSON或键值对的轻量级格式)强加了这么多 编程良好索引机制(在...上运行)的I / O开销 内存中对case-base的描述将只加速一小部分因此 没有实质性的好处。
现在我认为有两种解决方案
a)尝试直接索引到文件中,同时执行I / O和索引 时间。
b)以某种方式保存case-base的内存中表示的内存映像 进入文件,以便“文件解析”然后简化为一个简单的memcpy(包括内存映射文件)。注意 文件格式是二进制的,而不是基于a)的UTF-8。
有没有人遇到过类似的问题并尝试了一些东西 b)的行?