python - 机器学习二元分类

时间：2021-01-08 12:23:04

标签： python machine-learning

我正在尝试使用多层感知器进行二元分类。

基本上是对句子的情感分析。目前只有二进制。正与负（目前我的数据中没有中性），所以它是二元的。

我发现一件奇怪的事情是，当正数编码为 1（正数=1，负数=0）和负数编码为 1（正数=0 ，负=1）。当然，我使用了相同的 X 数据集和相同的模型（架构）。只更改了标签编码。

当正例被编码为 1 时，平均 f1 分数约为 89。（我运行相同模型 10 次）当否定案例被编码为 1 时，平均 f1 分数约为 50。（我运行了 10 次相同的模型）

我对这个结果很困惑。我认为应该没有任何显着差异。

答案 0 :(得分：1)

F1-score 是准确率和召回率的调和平均值，公式为：

TP/(TP + 1/2(FP + FN))。更多细节在这里：https://en.wikipedia.org/wiki/F-score .

因此，您可以观察到公式中没有太多对称性，并且偏向于真正的正数。准确性如何？