粗略地说,马氏距离是多元高斯分布(μ,Σ)与一个点之间的距离。如果高斯分布表示一个类,则可以通过选择距离最小的类来对新点进行分类。
我要提供经过N * D训练的数据作为类数据,并且我需要计算mu和Sigma的逆。
Estimates the parameters for the mahalanobis distance for a specific class.
:param x_class: a (n x d) numpy array, containing n samples with d features coresponding to a specific class.
:return: tuple of (mu, inv_Si)
where mu is a (d,) numpy array
inv_Si is a (d, d) numpy array.
我正在使用MLE估计器,我得到了正确的均值,但是我没有纠正逆协方差矩阵。
火车数据具有74 * 4 N * D的大特征。
可以正确拟合数据的替代估算器有哪些?
我尝试使用OAS等其他估计量,但均值和逆协方差矩阵都不正确。
最佳估计器是EmpiricalCovariance估计器。但是我从中得到了一个正确的均值,但是它的逆协方差矩阵相对于测试用例的负差为2.0或3.0。