在r中加载.phased文件

时间:2014-04-23 13:00:36

标签: r

有没有办法在r中加载this文件(“加载”不起作用)?我不熟悉这种格式,我在网上找不到任何东西。

感谢。

1 个答案:

答案 0 :(得分:1)

temp <- read.table("http://tau.ac.il/~saharon/StatGen2014/hapmap3_r2_b36_fwd.consensus.qc.poly.chr22_yri.phased", sep = "\t", header = T)

以下请求的解释:如果您输入?read.table,您将看到file参数可以接收完整的URL路径(您可以键入?url进行进一步的入侵)。

运行textConnection("http://tau.ac.il/~saharon/StatGen2014/hapmap3_r2_b36_fwd.consensus.qc.poly.chr22_yri.phased")

您可以看到连接已打开且可以访问R

# "\"http://tau.ac.il/~saharon/StatGen2014/hapmap3_r2_b36_fwd.consensus.qc.poly.chr22_yri.phased\"" 
# class 
# "textConnection" 
# mode 
# "r" 
# text 
# "text" 
# opened 
# "opened" 
# can read 
# "yes" 
# can write 
# "no" 

sep中的read.table参数是字段分隔符。确定此数据如何分离的一种方法是在getURL包中使用Rcurl函数

library(RCurl)
txt <- getURL("http://tau.ac.il/~saharon/StatGen2014/hapmap3_r2_b36_fwd.consensus.qc.poly.chr22_yri.phased")
str(txt)
# chr "rsID\tposition_b36\tNA19095_A NA19095_B\tNA19096_A NA19096_B\tNA18867_A NA18867_B\tNA18868_A NA18868_B\tNA18924_A NA18924_B\tNA"| __truncated__

您可以在数据集值之间看到\t分隔符。

现在剩下的就是使用基本R函数read.table,同时使用\t分隔符并使用header = T运算符指示数据集包含标题