如何计算MongoDB中文档之间的相似性

时间:2017-03-29 00:44:44

标签: node.js mongodb mongodb-query aggregation-framework

我试图在MongoDB中找到给定文档的k最近邻居。

我的想法是计算文件之间的相似性并返回最高的k文件。

数据格式:

{
    id:1024,
    class:'patient',
    name:'Alex',
    gender:'male',
    livingSuburb:'place A',
    nearestHospital:'hospital A'
    treatments:[
                {date:20170101,disease:'flu',medicine:['drug A','drug B']},
                ...]
}

我的预期输入是:

[{id:1024}]

我想将所有参数纳入计算中,因为我想找到k个最相似的患者并使用他们的数据进行进一步的研究。

我的预期输出是:

[
    {id:1201,similarity:0.98},
    {id:1108,similarity:0.93},
    {id:0001,similarity:0.88},
    ...
]

我的藏品中有大约100,000份文件。

是否可以使用NodeJS + MongoDB实现此功能?

0 个答案:

没有答案