R

时间:2018-03-09 05:40:43

标签: r merge mapping fuzzy-comparison

我有1个数据集,如果条件匹配,则希望模糊匹配自身

  1. Soundex和辅音应该相同
  2. 性别应该相同
  3. 模糊匹配数据,如果年龄为+ -5(如果1行的年龄为10岁,那么匹配的行应该具有年龄b / w 5到15)
  4. 为了简化这个过程,我运行了声音表达式功能,通过该功能,我获得了类似声音的SoundEX代码。以下是样本数据集。

    Age2    Gender4 Consonants2 Name_of_Patient_nospace2    SoundEx
    5   F   h   Ahoi    A0
    31  M   h   Ahoi    A0
    35  F   y   AYEE    A0
    33  F   y   AAYEE   A0
    39  F   y   AYEE    A0
    32  F   y   Ayai    A0
    35  M   r   Aro A090
    35  M   r   ARAAO   A090
    33  M   r   ARao    A090
    30  M   r   Arei    A090
    35  M   r   Aro A090
    35  M   r   ARAAO   A090
    33  M   r   ARao    A090
    30  M   r   Arei    A090
    65  M   r   AARI    A090
    

    获得1对多匹配输出的代码是什么? 例如:如果我们有2个表都有相同的记录(1,2,3),那么输出应该如下(按照1到n的映射)

    1-1
    1-2
    1-3
    2-2
    2-3
    3-3
    

    以下是基于1对多映射的上述数据集的示例输出(所需输出)(仅供参考,仅显示SoundEx:A0输出)。

    Age2    Gender  Consonants2 Name_of_Patient_nospace2    SoundEx Age2_Copy   Gender_Copy Consonants2_Copy    Name_of_Patient_nospace2_Copy   SoundEx_Copy
    5   F   h   Ahoi    A0  5   F   h   Ahoi    A0
    31  M   h   Ahoi    A0  31  M   h   Ahoi    A0
    35  F   y   AYEE    A0  35  F   y   AYEE    A0
    35  F   y   AYEE    A0  33  F   y   AAYEE   A0
    35  F   y   AYEE    A0  39  F   y   AYEE    A0
    35  F   y   AYEE    A0  32  F   y   Ayai    A0
    33  F   y   AAYEE   A0  33  F   y   AAYEE   A0
    33  F   y   AAYEE   A0  39  F   y   AYEE    A0
    33  F   y   AAYEE   A0  32  F   y   Ayai    A0
    39  F   y   AYEE    A0  39  F   y   AYEE    A0
    39  F   y   AYEE    A0  32  F   y   Ayai    A0
    32  F   y   Ayai    A0  32  F   y   Ayai    A0
    

0 个答案:

没有答案