在R脚本中,我有一个DataFrame,格式为:
SELECT c.name, c.description, cu.name cu_name
FROM companies c
INNER JOIN offers o ON o.id_company = c.id
INNER JOIN company_customer cc ON cc.id_company = c.id
INNER JOIN customers cu ON cu.id = cc.id_customer
WHERE o.id_company = 1
ORDER BY o.id_company;
第一列是String名称,以下是数值。 值的总数不是先验已知的,而是取决于作为脚本输入提供的数据集。
我想只提取从第二个到最后一个元素的总和(或平均值)大于某个阈值的行。
如何以R风格做到这一点?
答案 0 :(得分:5)
我们可以使用rowSums/rowMeans
数字列,使用>
获取逻辑向量并对行进行子集化。
thresh <- 0.0001
df1[rowSums(df1[,-1])> thresh,]