我想在sklearn包中找到一类路径上每个特征的基尼系数 例如在虹膜数据中。像Iris-virginica花瓣长度基尼:0.4,花瓣宽度基尼:0.4。
答案 0 :(得分:2)
您可以使用Python + numpy计算基尼系数,如下所示:
from typing import List
from itertools import combinations
import numpy as np
def gini(x: List[float]) -> float:
x = np.array(x, dtype=np.float32)
n = len(x)
diffs = sum(abs(i - j) for i, j in combinations(x, r=2))
return diffs / (2 * n**2 * x.mean())