我正在用Python从SKLearn训练ML模型,有时需要将它们导出为文本(作为数学方程式)。
进行线性回归时,这非常简单:我使用目标的名称(T
),系数(C1...Cn
),截距(C0
)和要素名称(A1...An
)来构造以下形式的字符串:
T = C0 + C1A1 + C2A2 + ... + CnAn
但是,我不确定我对分类算法的实现。
例如,假设我有一个经过训练的Logistic回归分类器,可以使用n个特征(A1, ..., An
)在m个类(T1, ..., Tm
)之间进行分类。
如果我理解正确,我可以从分类器(Cij
,用i=1,2,..,m
和j=0,1,...,n
)中提取系数和截距以编写以下集合:
f(T1) = C10 + C11A1 + C12A2 + ... + C1nAn
.
.
.
f(Tm) = Cm0 + Cm1A1 + Cm2A2 + ... + CmnAn
比要选择的类多的是函数产生最大数量的类。
这种说法正确吗?