机器学习二元分类

时间:2021-01-08 12:23:04

标签: python machine-learning

我正在尝试使用多层感知器进行二元分类。

基本上是对句子的情感分析。目前只有二进制。正与负(目前我的数据中没有中性),所以它是二元的。

我发现一件奇怪的事情是,当正数编码为 1(正数=1,负数=0)和负数编码为 1(正数=0 ,负=1)。当然,我使用了相同的 X 数据集和相同的模型(架构)。只更改了标签编码。

当正例被编码为 1 时,平均 f1 分数约为 89。(我运行相同模型 10 次) 当否定案例被编码为 1 时,平均 f1 分数约为 50。(我运行了 10 次相同的模型)

我对这个结果很困惑。我认为应该没有任何显着差异。

1 个答案:

答案 0 :(得分:1)

F1-score 是准确率和召回率的调和平均值,公式为:

TP/(TP + 1/2(FP + FN))。更多细节在这里:https://en.wikipedia.org/wiki/F-score .

因此,您可以观察到公式中没有太多对称性,并且偏向于真正的正数。准确性如何?