我们定期运行员工控制(基于employee_id),执行不同类型的交易(基于transaction_id)。为此,我们提取了一份实时生产数据样本(由Loi de Poisson调整大小)。
问题是: 如何确保每种类型的交易都是样本的一部分,并且每个员工也在样本中受到控制,因为他们知道并不总是两者兼而有之。
例如,这是我的实时数据(当然,我的数据要大得多)。
Transaction_id Employee_id
100 123456
100 234567
101 123456
203 234567
203 345678
301 234567
我必须确保在我的示例中,所有transaction_id至少被选中一次(100,101,203和301)。我还必须确保我的所有员工至少被选中一次(123456,234567,345678)。所以样本应该是
301, 234567 -> only possibility
203, 345678 -> only possibility because if I select the other employee_id 234567, then employee_id 345678 will never be controlled
101, 123456 -> only possibility
100, 123456 or 234567
您如何建议我编写SQL语句以确保示例数据至少包含一个transaction_id和至少一次employee_id?