在R中为上传的数据框子集

时间:2014-07-08 01:48:58

标签: r

这是课堂作业,所以我无法解决主要问题。我们必须对提供给我们上传的特定数据进行子集化。假设我们给它变量名称mydata。它是csv格式的excel表文件。所以,我们上传了它并且已经完成了其他问题。这是以这种方式上传的。 mydata< - read.csv(name_of_file)

mydata有六个带标题的列。现在,假设列名如下:abc efg hij klm nop qrs。现在,问题是这样的:

&#34;提取abc值<50且klm <100的数据。这个子集中hij的平均值是多少?&#34;

我知道卑鄙是卑鄙的()。但是,我怎么能同时提取所有值作为这个大表的子表,所以我知道两个约束都满足,我也可以看到hij,所以我可以采取它的意思。请不要告诉我如何取平均值,因为它是考试的测验。我会自己找到的。但是,请告诉我如何提取所有这些约束和提取必须是完整的子数据,所以我可以看到hij。请不要申请。这是第一次测试。申请进入第二次测试。

2 个答案:

答案 0 :(得分:0)

如果dat是数据集

subDat <- subset(dat, abc <50 & klm <100)

如您所述,您可以从subDat找到均值。

答案 1 :(得分:0)

子集的另一种方法是(对于原始数据集mydata)

subData <- mydata[mydata$abc < 50 & mydata$klm < 100, ]

这将选择满足条件的数据框中的所有行。逗号后面的空白表示将返回匹配行的所有列(在dataframe subData中)。