标签: stata
我正在尝试确定大约10个不同学术课程之间有多少课程重叠。我想知道哪些团体至少共有4门课程。数据集有两列: progID - 确定学术课程 courseID - 识别课程
我正在寻找伪代码或算法来解决这个问题。现在我最好的想法是遍历所有10个程序,并使用“联合”功能相互比较它们。但这需要9个!循环,似乎效率低下。有谁能指出我更好的算法?谢谢。