所有,我有一个包含 m x n
矩阵数据的大型 CSV 文件,带有行标签和列标题。我希望用这个输入文件在 R 中生成一个稀疏矩阵(例如,dgCmatrix
对象)。我们希望避免在 R 中读取内存中的完整矩阵,然后将其转换为稀疏矩阵。我想知道 R 中是否还有其他直接的方法可以做到这一点?
我想关键是从原始 CSV 生成 {row index, column index, value} 表示。我遇到了 this 非常有用的 python 脚本,首先将 CSV 转换为三列格式,但这可能意味着将另一个文件写入磁盘并在 R 中重新读取。或者,我看到编写 C++ 代码来构造来自原始 CSV 的稀疏表示,并通过 Rcpp 将其集成是一种选择,但也许有更直接的解决方案?
谢谢!