Python:如何为给定的特征向量找到最相似的标签?

时间:2018-04-16 14:58:21

标签: python machine-learning

我正在寻找机器学习方法来找到给定特征向量的最可能的类标签(具有概率值)。我有一个n类训练集,大部分特征向量由布尔值组成。到目前为止,我正在考虑计算要素和归一化的真值的数量(例如,m =训练样本的数量,对于一个特征值为真,n =训练样本的数量.throw_val = m / n)它创建一个代表性的一个类的特征向量。一旦创建,相似性度量就像类表示向量和给定特征向量之间的余弦距离或eucledian距离。 任何人都可以建议这种方法是否值得实施?

1 个答案:

答案 0 :(得分:0)

您尝试解决的问题称为分类,是监督学习的主要部分。一个很好的起点是一个名为scikit-learn的开源​​库及其文档(试试this)。

有很多分类模型可供选择,但是一旦你选择了一个特定的分类模型并进行训练,那么你只需使用predict_proba方法来获得给定特征向量或矩阵的概率。