我们在python中编写分类代码,我们希望获得属于每个类的样本的概率作为输出。我们如何从分类器中获取概率而不是类标签? 我们想知道样本属于每个类的概率。 (例如:如果有9个类,我们需要样本概率属于第1类,第2类等等)然后我们需要根据概率预测将它们放在类中并检查准确性。 我们根据提取的特征对数据样本进行分类(如操作码,API调用等)。 我们不想使用Weka进行分类。
编辑:我们计划使用像NaiveBayes这样的概率分类器。 使用的库是Numpy,scikitlearn 另外,是否有特定的格式应该获得功能?
答案 0 :(得分:-1)
您可以采取许多方法。一种方法可以是使用ANN,简单的前馈网络,并使用输出值作为输入属于/不属于该类的概率。在下一个级别,可以采用更精细的方法来获得跨类的概率,参考:this post。一些提供ANN实现的Python库:are listed here