从集群中找到文档的正确匹配项

时间:2019-01-15 00:27:11

标签: python machine-learning

我有两组对象流,分别是X和Y,它们都是多维的。

示例: X->事件1 {CPU,50%,40分钟前},事件2 {数据库中断,30分钟前},事件3 {CPU,60%,10分钟前} .... etc。

集群1-> {事件1,事件3} 群集2-> {事件2}

Y->任务1 {修复CPU的增加,代码错误},任务2 {解决数据库中断的错误修复} ...等等。

给定任务1->它应与集群1相匹配 任务2->它应该与集群2匹配

我正在使用TF-IDFVectorizer和K-means算法在流X上实现聚类,但是找不到解决方案来将文档从Y匹配到X。

对此,任何指针将不胜感激。

0 个答案:

没有答案