读取制表符分隔的文本文件

时间:2017-03-15 19:34:44

标签: r

我正在尝试使用以下代码从R中的 this 链接读取数据,但我不断收到警告消息,并且数据框无法正确读取数据。

url <- 'https://onlinecourses.science.psu.edu/stat501/sites/onlinecourses.science.psu.edu.stat501/files/data/leukemia_remission.txt'
df <- read.table(url, sep = '\t',header = F, skip = 2,quote='', comment='')

你能告诉我需要改变什么才能阅读数据

修改

添加数据代码段

REMISS  CELL    SMEAR   INFIL   LI  BLAST   TEMP
1   0.8 0.83    0.66    1.9 1.1 1
1   0.9 0.36    0.32    1.4 0.74    0.99
0   0.8 0.88    0.7 0.8 0.18    0.98
0   1   0.87    0.87    0.7 1.05    0.99
1   0.9 0.75    0.68    1.3 0.52    0.98
0   1   0.65    0.65    0.6 0.52    0.98
1   0.95    0.97    0.92    1   1.23    0.99
0   0.95    0.87    0.83    1.9 1.35    1.02

2 个答案:

答案 0 :(得分:7)

这是关于编码的问题。有关详细信息,请参阅此主题(Get "embedded nul(s) found in input" when reading a csv using read.csv())。

url <- 'https://onlinecourses.science.psu.edu/stat501/sites/onlinecourses.science.psu.edu.stat501/files/data/leukemia_remission.txt'
df <- read.table(url, sep = '\t',header = TRUE, fileEncoding = "UTF-16LE")

答案 1 :(得分:0)

还要考虑,

url <- 'https://onlinecourses.science.psu.edu/stat501/sites/onlinecourses.science.psu.edu.stat501/files/data/leukemia_remission.txt'
df <- read.csv(url, sep="\t", header=T)