Microsoft R .xdf文件

时间:2017-04-20 20:33:34

标签: r microsoft-r

我对.xdf文件有一些疑问:

  1. 这是什么意思?
  2. 这种类型的文件是如何工作的?
  3. Microsoft R如何使用这种文件?
  4. data.frames又有什么优势?
  5. 我真的很期待你的回答。

    问候R123456789

1 个答案:

答案 0 :(得分:5)

  1. XDF文件是压缩的二进制文件格式,具有用户可选择的压缩级别,可在此处找到一些快速事实:https://support.microsoft.com/en-us/help/3104260/qa-what-is-the-.xdf-file-format XDF文件有两种形式,独立和复合。对于独立XDF文件,您将看到存储在磁盘上的单个文件,扩展名为.xdf。对于Composite,XDF文件由一个目录表示,该目录包含元数据和数据子目录。此外,对于Composite,目录中的元数据和数据文件将被拆分并单独压缩为XDF部件文件。
    1. 这是Microsoft R Server内部的专有实现,我可以扩展这个答案,但我需要改进一个问题,“这种类型的文件如何工作?”
      1. XDF文件存储在磁盘上,不存在于内存中。调用RxXdfData()或rxImport()的Microsoft R Server将读取XDF文件并将其解压缩,然后将其作为数据帧插入内存。许多Microsoft R“rx”函数可以直接将XDF路径作为数据源或接收器,并根据需要管理将段读入内存。
        1. 使用XDF作为数据源/接收器的优点是,您无需将整个文件缓冲到内存中,Microsoft R Server就可以使用它。它允许部分读取和写入,以及通过压缩围绕磁盘空间的其他优化。它将比平面文件的读/写操作更快,因为元数据用于索引XDF。缺点主要在于性能,在所有情况下,数据内存(data.frames)的操作速度都比磁盘上的数据快。
        2. 注意:与所有文件一样,底层操作系统控制何时将文件从内存写入磁盘。出于您的问题的目的,可以假设XDF文件作为标准文件驻留在磁盘上。