Question

我的数据如下

ID  DM
1.1.1.22  UDP-glucose 6-dehydrogenase.
1.1.1.23  Histidinol dehydrogenase.
1.1.1.24  Quinate dehydrogenase.
1.1.1.25  Shikimate dehydrogenase.
1.1.1.26  Glyoxylate reductase.
1.1.1.27  L-lactate dehydrogenase.
1.1.1.28  D-lactate dehydrogenase.
1.1.1.29  Glycerate dehydrogenase.
1.1.1.30  3-hydroxybutyrate dehydrogenase.
1.1.1.31  3-hydroxyisobutyrate dehydrogenase.

我正尝试像以下那样加载它们，但它会加载3列或更多列。我该如何解决？

df <- read.table("path to my data.txt", header=F, fill=T)

有了这个，我只有一列

df <- read.delim2("path to my data.txt", header=F, fill=T)

或read.delim

基本上我希望它只是ID和DM两列

Answer 1

考虑到OP的Input_file是TAB分隔的，请尝试执行以下操作。

var <- read.table(Input_file, sep = "\t" , fill=T, header = F, na.strings ="", stringsAsFactors= F)

这只是一个示例，您也可以根据需要编辑选项。

Answer 2

您可以将定界符更改为“”（双精度空格，不确定是否可以），也可以将每条记录放在第二栏中用双引号引起来。

如何导入不会在几列中加载的数据

2 个答案: