具有大量数据的两个表之间的比较

时间:2019-07-12 08:44:53

标签: python-3.x mongodb

我是python的新手,并且将python与mongo db一起使用。谁能帮助我解决以下概念?

Table A
-------

Id(A)   || Value
---------------------------------------
1001    || Hi Ram How are you Today
1002    || Good Day
1003    || Hi Ganesh are you okay today


Table B
-------

Id(B)   || Value                || Id(A)
------------------------------------------
901     || How are you today    ||
902     || are you okay today   ||

我想知道如何将这两个表Table A(包含带有unique ID的1000万条记录)和Table B(包含10万条记录)与value列进行比较,以进行更新column Id(A)中的Table B

我不想将Value列与(=)运算符进行比较(即不是直接匹配),我想将两个值列(表A和表B)拆分为一个单词(即使用空格分隔符),然后将splited的{​​{1}}值与Table B拆分值列中的每一行进行比较,以获取每行的匹配计数最高,然后是最高Id计数(表A Id)应在表B Id(A)列中更新。

有没有有效的方法来获得结果?

0 个答案:

没有答案