标签: memory apache-arrow
Apache Arrow是内存中的序列化格式。 Arrow的一部分是Plasma,这是一种内存对象存储,旨在在同一台计算机上的进程之间高效地共享数据。我想更好地了解这是什么。
我对工作原理的一阶近似是通过将Arrow序列化的数据放入共享内存(在IPC的意义上),并允许多个进程从中读取(但不能写入)。这是Plasma内存存储中几乎所有的东西吗?还是在引擎盖下发生了更复杂的事情?
我怀疑Plasma仅将进程所需的内存中Arrow数据结构的特定部分有效地映射到了该进程的地址空间中。