我有一个我要导入的大型数据矩阵。令人讨厌的是,所有“NA”值都显示为“*****”,当我将数据读入R时,它会作为因子矩阵导入。
str(x)
'data.frame': 5 obs. of 5 variables:
$ 1: Factor w/ 704 levels "*****","0","100.1",..: 2 457 531 550 598
$ 2: Factor w/ 689 levels "*****","0","100",..: 473 2 113 440 515
$ 3: Factor w/ 711 levels "*****","0","100.1",..: 485 379 2 184 514
$ 4: Factor w/ 709 levels "*****","0","100.1",..: 534 491 47 2 542
$ 5: Factor w/ 681 levels "*****","0","100.6",..: 590 561 548 554 2
> x[988:993,988:993]
988 989 990 991 992 993
988 0 ***** ***** ***** ***** *****
989 ***** 0 ***** ***** ***** *****
990 ***** ***** 0 ***** ***** *****
991 ***** ***** ***** 0 ***** *****
992 ***** ***** ***** ***** 0 *****
993 ***** ***** ***** ***** ***** 0
矩阵的最后几个值没有数据,显示为“*****”。我需要一种方法将它们的值设置为“0”,这样我的矩阵就会显示为数字。
答案 0 :(得分:1)
在读取文件时添加两个参数:
na.strings = "*****", stringsAsFactors = FALSE