在R中,formula
是分类器的常见参数,例如glm
,tree
和svm
。但是,作为Sklearn的用户,在使用Sklearn中的数据向SVM提供时,我找不到像formula
这样的参数。
例如,document of SVM in Scikit-learn
中的块代码>>> from sklearn import svm
>>> X = [[0, 0], [1, 1]]
>>> y = [0, 1]
>>> clf = svm.SVC()
>>> clf.fit(X, y)
#SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0, degree=3,
#gamma=0.0, kernel='rbf', max_iter=-1, probability=False, random_state=None,
#shrinking=True, tol=0.001, verbose=False)
另一方面,在R
中的包e1071
中
data(cats, package = "MASS")
m <- svm(Sex~., data = cats)
参数Sex~.
作为训练SVM的公式,使用Scikit-learn时则不然。
然后我很好奇在R中训练SVM时指定formula
背后的特殊原因。因为我们不必在Sklearn中这样做。