使用R匹配相似的字符串

时间:2017-03-15 04:10:36

标签: r pattern-matching similarity

我有一个项目(A)加上另一个可能的匹配列表(B)。

我正在寻找一种技术(最好是在R中),它会在项目A的列表B中返回最佳匹配。

例如

项目

  • 标题:宝贝再来一次
  • 艺术家:布兰妮斯皮尔斯
  • 长度:4:01

列表

  • 标题|长度|查看|频道
  • 布兰妮斯皮尔斯 - ......宝贝再来一次 时间| 3.57 | 253292922 | BritneySpearsVEVO
  • 布兰妮斯皮尔斯再次击中我的宝贝官方音乐视频 HQ | 0.46 | 12345 | nevernever
  • 布兰妮斯皮尔斯 - 再一次打我的宝贝(视频封面)| 2 | 21 | 9876 | scoobydoo
  • 布兰妮斯皮尔斯 - 再来一次宝贝(未经删剪版)| 3.43 | 23627 | Benjo4EverStudioXDL
  • 布兰妮斯皮尔斯 - 哎呀!......我再来一次(官方视频)| 4.12 | 183483929 | BritneySpearsVEVO

显然最好的匹配是第一个,列表中的大多数元素都有助于指出答案。什么是在R中解决这个问题的最好方法?

理想情况下,它会为#1返回100%的可能性,然后为其他人返回显着低于100%的可能性。

我正在寻找一个指针,然后我可以离开并进行研究。

谢谢!

0 个答案:

没有答案