我有数以百万计的混淆矩阵。我应该使用哪种数据挖掘方法来总结它们或找到这些矩阵之间的关系? 如果你能给我一些对我有帮助的提示,我将感激不尽。
答案 0 :(得分:0)
该方法取决于您想要找到的关系类型。
您的关键问题应该是如何衡量这些矩阵的相似性。
答案 1 :(得分:0)
Confusion matrix主要用于给出分类模型性能的数值。你有数百万人,这既奇怪又有趣! (如果你添加一些解释,那么你最终会得到数百万个混淆矩阵会有所帮助!)
如果您的混淆矩阵来自此类程序,那么您可能需要处理他们给出的费率(例如'准确性','精确度''特异性& #39;,'召回'等)作为您的新功能。然后,基于这些功能,您可以直接应用另一个分类/聚类模型来实现您的最终目标,或者从一些feature selection开始(例如使用描述性统计:Min,Max,Mean,Median,Var)或feature extraction以减少空间的复杂性(维度)。