我有一个网络边缘列表,我想使用scikit-learn中的Label Spreading / Label Propagation算法。我有一组标记的节点,并希望将标签分布在网络的未标记部分。如果需要,我可以生成邻接矩阵或混淆矩阵。
有人可以使用scikit指向正确的方向吗?文档似乎对我能用它做的事情有限。
提前谢谢。
答案 0 :(得分:1)
要使用标签传播,您应该按照以下步骤操作: 1.创建标签向量(y),其中所有未标记的实例都设置为-1。 2.使用特征数据(X)和y拟合模型。 3.使用stats.distributions.entropy创建predict_entropies向量( yourmodelname .label_distributions_.T) 4.通过对predict_entropies向量进行排序来创建不确定性指数。 5.发送最低确定性样本进行标签查询。
我希望这个框架可以帮助您入门。