以下两个查询在R studio v_0.96
中运行时提供相同的输出1)
ab<-sqldf('select a.Family_tree_id, a.parent_name
from test as a, test as b
where a.child_id <> b.parent_id
group by a.Family_tree_id')
2)
cd<-sqldf('select a.Family_tree_id, a.parent_name
from test as a
where a.parent_name NOT IN
(select b.child_name from test as b)')
我似乎不明白同一答案背后的原因,虽然看起来第一个完成的工作与第二个完全不同。我对SQL不是很有经验,所以请耐心等待。是否需要更多关于数据集的信息才能回答这个问题?
答案 0 :(得分:0)
尽管如Paul所说,数据集会派上用场,但两个查询之间有几个重叠:
此外,在您的第二个查询中,, test as b
没有用处。