如何导入不会在几列中加载的数据

时间:2019-01-15 05:53:29

标签: r

我的数据如下

ID  DM
1.1.1.22  UDP-glucose 6-dehydrogenase.
1.1.1.23  Histidinol dehydrogenase.
1.1.1.24  Quinate dehydrogenase.
1.1.1.25  Shikimate dehydrogenase.
1.1.1.26  Glyoxylate reductase.
1.1.1.27  L-lactate dehydrogenase.
1.1.1.28  D-lactate dehydrogenase.
1.1.1.29  Glycerate dehydrogenase.
1.1.1.30  3-hydroxybutyrate dehydrogenase.
1.1.1.31  3-hydroxyisobutyrate dehydrogenase.

我正尝试像以下那样加载它们,但它会加载3列或更多列。我该如何解决?

df <- read.table("path to my data.txt", header=F, fill=T)

有了这个,我只有一列

df <- read.delim2("path to my data.txt", header=F, fill=T)

或read.delim

基本上我希望它只是ID和DM两列

2 个答案:

答案 0 :(得分:1)

考虑到OP的Input_file是TAB分隔的,请尝试执行以下操作。

var <- read.table(Input_file, sep = "\t" , fill=T, header = F, na.strings ="", stringsAsFactors= F)

这只是一个示例,您也可以根据需要编辑选项。

答案 1 :(得分:0)

您可以将定界符更改为“”(双精度空格,不确定是否可以),也可以将每条记录放在第二栏中用双引号引起来。