node.js - 如何计算MongoDB中文档之间的相似性

我试图在MongoDB中找到给定文档的k最近邻居。

我的想法是计算文件之间的相似性并返回最高的k文件。

数据格式：

{
    id:1024,
    class:'patient',
    name:'Alex',
    gender:'male',
    livingSuburb:'place A',
    nearestHospital:'hospital A'
    treatments:[
                {date:20170101,disease:'flu',medicine:['drug A','drug B']},
                ...]
}

我的预期输入是：

[{id:1024}]

我想将所有参数纳入计算中，因为我想找到k个最相似的患者并使用他们的数据进行进一步的研究。

我的预期输出是：

[
    {id:1201,similarity:0.98},
    {id:1108,similarity:0.93},
    {id:0001,similarity:0.88},
    ...
]

我的藏品中有大约100,000份文件。

是否可以使用NodeJS + MongoDB实现此功能？

如何计算MongoDB中文档之间的相似性

0 个答案: