我有一个大数据集,并且变量包含不同的格式 例如2、3,> 2,<4,“我去<>上学”。 “我必须<在那里”。
如何制作仅包含诸如<2或> 10(小于或大于数字)之类的行的数据集的子集?
Subject Result
1 3
2 4
3 <4
4 <3
5 I need to go to school<>
6 I need to <> be there
7 2.3 need to be< there
答案 0 :(得分:1)
df[grep("^\\s*[<>][0-9]+$", df$variable),]
这将生成df
的子集,其中的所有行的列variable
中的数据均采用以<或>开头的数字格式,其后仅是数字。>
我添加了\\s*
,因为从您的数据看来,某些情况下数字之前有填充空格,因此将删除所有此类空格。