'水平' R中的函数返回不正确的结果

时间:2016-03-25 14:45:30

标签: r csv levels

我在R中有一个包含多个组的数据表,每个组都有多个读数,如下所示:

Example Data Table

因此每个样本(例如' 7001')都有一个年龄(15),每个样本有多个图像构成表格的行,每个图像都有一个与之相关的结果。

表格非常大,我认为结构可能存在问题。因为我从“等级”中得到了异常的结果。功能。

执行以下操作:

  levels(Sample_No.)

返回正确的结果([1]" 7001"" 7002"" 7003"" 7004" ...)。但是,如果我尝试对数据进行子集,例如按年龄分类:

levels(Sample_No.[Age=="15"])

我仍然得到相同的读数,而不仅仅是年龄为15岁的样本数字。 为了进一步研究这一点,我只使用了我的表的第一个和最后几个值(最初是6000行)来创建一个新表,如下所示:

newlist = rbind(head(oldlist), tail(oldlist))

这个列表只有12行,当然只包含两个样本编号(比如" 7001"" 7200")当我运行levels(newlist$Sample_No.) I get the same readout as before ( 1时`" 7001" " 7002" " 7003" " 7004" ..." 7200")。

这告诉我,这不仅仅是一些错位的年龄值问题,而是表格或我用于子集的命令的问题。

提前感谢您的帮助。

其他信息: 表尺寸:6116乘15。 文件格式为.csv,使用read.csv命令读取所有默认值(Header = TRUE)

0 个答案:

没有答案