我有两组对象流,分别是X和Y,它们都是多维的。
示例: X->事件1 {CPU,50%,40分钟前},事件2 {数据库中断,30分钟前},事件3 {CPU,60%,10分钟前} .... etc。
集群1-> {事件1,事件3} 群集2-> {事件2}
Y->任务1 {修复CPU的增加,代码错误},任务2 {解决数据库中断的错误修复} ...等等。
给定任务1->它应与集群1相匹配 任务2->它应该与集群2匹配
我正在使用TF-IDFVectorizer和K-means算法在流X上实现聚类,但是找不到解决方案来将文档从Y匹配到X。
对此,任何指针将不胜感激。