需要为交易数据生成客户ID

时间:2019-06-30 12:19:34

标签: r duplicates

我有一段时间的客户交易数据,他们一段时间内使用了多个电子邮件和电话号码。如何将所有电子邮件和电话号码关联到一个ID。我当前的数据框采用以下格式

Name               Phone        Email
Ram                123456788    ram@gmail.com
Ram Fernandes      123456788    r1@live.com
Ram F              213456789    r1@live.com
Ram Fern           213456789    ram@msft.com
Matthews           123456798    Matt@msft.com

输出应为

ID      Name
Cust 1  Ram
Cust 1  Ram Fernandes
Cust 1  Ram F
Cust 1  Ram Fern
Cust 2  Matthews

1 个答案:

答案 0 :(得分:0)

我们可以提取单词"@"之前的电子邮件的第一部分以获取firstName,然后使用for循环查看先前的任何条目是否具有相同的{{1 }}或firstName。如果存在匹配项,则使用该Phone或增加ID变量。

ID