我正在使用sklearn DecisionTreeClassifier,我想创建自己的条件函数(默认情况下,您可以使用gini或熵,但它不是我正在寻找的)。这样的事情:
clf = DecisionTreeClassifier( criterion = 'my_function')
有可能吗?
是否有类似的算法允许这样做(在Python或R中)?
感谢。
答案 0 :(得分:1)
对于R,您可以使用rpart
package。特别是,请参阅User Written Split Functions插图。尽管决策树体验有限,但我能够按照示例使用自定义算法处理多变量输出。
但请注意,内置分类器使用快速外部库,因此如果您在plain R中编写算法,则处理速度可能会慢得多。正如小插图所指出的那样,由于预期的减速,默认情况下会禁用交叉验证。如果您的数据“足够小”(或者您可以等待一段时间),这可能不是您的问题。