Question

我有一个大约30K行的CSV文件，我正在使用

将其读入变量

bugs=read.table("bugs.txt", sep="~", header=T, stringsAsFactors=F)

我正在使用qplot和

构建一个简单的情节

qplot(data=bugs, x=version) + theme(axis.text.x = element_text(angle = 90, hjust = 1))

问题是图表包含所有数据。我想做的是消除任何计数小于250的版本。如果不手动修剪实际数据集本身，是否可以这样做？

我的csv列是

id~reporter~component~created~status~version

我是R的新手，并尝试使用我们的错误跟踪软件中的一些数据来学习它。

谢谢

Answer 1

如果没有重新定义 bugs，您可以在qplot调用中对数据框进行子集化：

qplot(data=filter(bugs, count_variable_name>=250), x=version) + theme(axis.text.x = element_text(angle = 90, hjust = 1))

其中filter是dplyr包中的函数。

目前尚不清楚您的数据集是什么样的，如果count是数据集中的显式变量，qplot使用的是什么geom。如果您提供有关数据集的详细信息，我可以提供更强大的答案。