使用H2O读取svmLigh格式

时间:2019-07-08 15:09:44

标签: r h2o svmlight

使用h2o R软件包(v 3.24.0.5)进行一些深度学习,我需要将一些大的稀疏矩阵[2M * 10k]导入其中。 我尝试使用fwrite,但是出现了cholmod问题太大错误,因此使用svmlight。 原始矩阵如下所示:

    Count    Dist    
1   nan     10.1266
2   859.124 10.8198
3   nan     10.1266

为此,我拿起了sparsio包,编写可以,但是当用h2o.importFile读取文件时,我注意到了一些错误: 我在每个数字的前面都获得了列索引,如下所示:

library(sparsio)
write_svmlight(HiC_mat.All, file="Rdata/mat_kmer-NA.txt")


HIC_df = h2o.importFile("Rdata/mat_kmer-NA.txt")

HIC_df[1:3,1:3]
  C1        C2        C3
1  0     0:nan 1:10.1266
2  0 0:859.124 1:10.8198
3  0     0:nan 1:10.1266

关于如何摆脱这些的任何想法吗?

数据应如下所示:

  C1        C2        C3
1  0       nan     10.1266
2  0    859.124    10.8198
3  0       nan     10.1266

1 个答案:

答案 0 :(得分:1)

好,所以问题似乎确实在我使用的svm文件的编写中:

write_svmlight(x, y = numeric(nrow(x)), file = filename, zero_based = FALSE) 

并且现在可以使用