我有一个大约30K行的CSV文件,我正在使用
将其读入变量bugs=read.table("bugs.txt", sep="~", header=T, stringsAsFactors=F)
我正在使用qplot
和
qplot(data=bugs, x=version) + theme(axis.text.x = element_text(angle = 90, hjust = 1))
问题是图表包含所有数据。我想做的是消除任何计数小于250的版本。如果不手动修剪实际数据集本身,是否可以这样做?
我的csv列是
id~reporter~component~created~status~version
我是R的新手,并尝试使用我们的错误跟踪软件中的一些数据来学习它。
谢谢
答案 0 :(得分:1)
如果没有重新定义 bugs
,您可以在qplot
调用中对数据框进行子集化:
qplot(data=filter(bugs, count_variable_name>=250), x=version) + theme(axis.text.x = element_text(angle = 90, hjust = 1))
其中filter
是dplyr包中的函数。
目前尚不清楚您的数据集是什么样的,如果count
是数据集中的显式变量,qplot
使用的是什么geom。如果您提供有关数据集的详细信息,我可以提供更强大的答案。