标签: machine-learning duplicates
当前用于检测同一客户的重复帐户的算法是什么? 这适用于那些试图隐藏他们打开两个不同帐户的客户。例如,他们可能会将其名称更改为较短版本或在其第二个帐户中使用其他电子邮件帐户。
使用什么样的算法?不确定像MinHashing这样的东西在这里是不是一个好主意。