我需要将一些非常混乱的数据联系在一起。最终,我想从官方公司来源收集employee_id值。我已经使用了大量的合并和合并完成了此操作,但是我想知道是否有更理想的方法。
问题是我正在使用人们可以进行的两个不同调查的数据:
- 输入错误
- 将他们的个人电子邮件地址放在用于其公司电子邮件地址的列中(显然这些调查没有经过验证……我与他们的设计或实现无关)
- 在“ company_id”字段中使用其员工ID或Windows NT ID。
- personal_email和personal_email_confirmation中的值不同
这意味着每个单独的列都可能是错误的,但是如果我检查每个字段,我经常会发现某人是谁。
什么是有效的方法?这是我需要做的一些可能的联接。每个成功的比赛都应删除,这样我最终可以得出一个真正的不比赛清单。在任何表格中都没有字段可以用来确定谁填写了调查。
将Survey2上的- company_email列发送给正式的company_email
- 在Survey2上发送电子邮件到在Survey1上发送电子邮件
- 在Survey2上的个人电子邮件到在Survey1上的个人电子邮件
- Survey1上的company_id到官方表上的employee_id
- Survey1上的company_id到官方表上的nt_id