我有不完整的数据,我正在尝试计算我有多少独特用户。电子邮件对应于user_ids,电子邮件和设备。可以安全地假设每个user_id可以有多个电子邮件和设备,这些电子邮件和设备只对应于该user_id。数据看起来像这样。
user_id email device
1 dave@ex.com
dave@ex.com 2w3e
dave@ex.com 1q2w
1q2w
2 3e4r
bill@ex.com 3e4r
bill@ex.com
chris@ex.com
4
4r5t
计算用户非常棘手。我拥有的最小不同用户数是3,但是,我可以有多达五个。
我应该如何计算两种情况下的数字?