我目前正在使用python学习分类(机器学习)。我已经练习了一些非常有趣的分类方法(例如:DecisionTrees,SVM等)。就像您现在所看到的那样,这种方法可以预测不同情况下的类别,但是,我想知道是否存在一种方法或方法,而不是预测不同主题的类别或标签,而是返回该主题为x类的概率。 例: 我有许多正在服用不同类型药物的患者。目前,我仅将数据分为测试/培训部分
df = pd.read_csv("DataSets/drug200.csv")
print(df)
#define x
x = df[["Age", "Sex", "BP", "Cholesterol", "Na_to_K"]].to_numpy()
print(str(x) + "\n")
#Convert bp, sex & cholesterol to numeric values
sex = preprocessing.LabelEncoder()
sex.fit(['F','M'])
x[:,1] = sex.transform(x[:,1])
bp = preprocessing.LabelEncoder()
bp.fit([ 'LOW', 'NORMAL', 'HIGH'])
x[:,2] = bp.transform(x[:,2])
chl = preprocessing.LabelEncoder()
chl.fit([ 'NORMAL', 'HIGH'])
x[:,3] = chl.transform(x[:,3])
y = df["Drug"]
#split data into train/test sets
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.3, random_state = 3)
现在,不是使用像DecisionTree这样的分类方法,而是要获取x个患者消耗n种药物的概率?