应用错误收集

使用R匹配相似的字符串

时间：2017-03-15 04:10:36

标签： r pattern-matching similarity

我有一个项目（A）加上另一个可能的匹配列表（B）。

我正在寻找一种技术（最好是在R中），它会在项目A的列表B中返回最佳匹配。

例如

项目

标题：宝贝再来一次
艺术家：布兰妮斯皮尔斯
长度：4：01

列表

标题|长度|查看|频道
布兰妮斯皮尔斯 - ......宝贝再来一次时间| 3.57 | 253292922 | BritneySpearsVEVO
布兰妮斯皮尔斯再次击中我的宝贝官方音乐视频 HQ | 0.46 | 12345 | nevernever
布兰妮斯皮尔斯 - 再一次打我的宝贝（视频封面）| 2 | 21 | 9876 | scoobydoo
布兰妮斯皮尔斯 - 再来一次宝贝（未经删剪版）| 3.43 | 23627 | Benjo4EverStudioXDL
布兰妮斯皮尔斯 - 哎呀！......我再来一次（官方视频）| 4.12 | 183483929 | BritneySpearsVEVO

显然最好的匹配是第一个，列表中的大多数元素都有助于指出答案。什么是在R中解决这个问题的最好方法？

理想情况下，它会为＃1返回100％的可能性，然后为其他人返回显着低于100％的可能性。

我正在寻找一个指针，然后我可以离开并进行研究。

谢谢！

0 个答案:

没有答案