有没有办法在r中加载this文件(“加载”不起作用)?我不熟悉这种格式,我在网上找不到任何东西。
感谢。
答案 0 :(得分:1)
temp <- read.table("http://tau.ac.il/~saharon/StatGen2014/hapmap3_r2_b36_fwd.consensus.qc.poly.chr22_yri.phased", sep = "\t", header = T)
以下请求的解释:如果您输入?read.table
,您将看到file
参数可以接收完整的URL路径(您可以键入?url
进行进一步的入侵)。
运行textConnection("http://tau.ac.il/~saharon/StatGen2014/hapmap3_r2_b36_fwd.consensus.qc.poly.chr22_yri.phased")
您可以看到连接已打开且可以访问R
# "\"http://tau.ac.il/~saharon/StatGen2014/hapmap3_r2_b36_fwd.consensus.qc.poly.chr22_yri.phased\""
# class
# "textConnection"
# mode
# "r"
# text
# "text"
# opened
# "opened"
# can read
# "yes"
# can write
# "no"
sep
中的read.table
参数是字段分隔符。确定此数据如何分离的一种方法是在getURL
包中使用Rcurl
函数
library(RCurl)
txt <- getURL("http://tau.ac.il/~saharon/StatGen2014/hapmap3_r2_b36_fwd.consensus.qc.poly.chr22_yri.phased")
str(txt)
# chr "rsID\tposition_b36\tNA19095_A NA19095_B\tNA19096_A NA19096_B\tNA18867_A NA18867_B\tNA18868_A NA18868_B\tNA18924_A NA18924_B\tNA"| __truncated__
您可以在数据集值之间看到\t
分隔符。
现在剩下的就是使用基本R函数read.table
,同时使用\t
分隔符并使用header = T
运算符指示数据集包含标题