我正在寻找一个机器学习工具包,它允许我指定自定义相似性度量以及选择我自己的数据表示。任何人都可以指向任何这样的工具包吗?最好是Python或Java。谢谢。
答案 0 :(得分:2)
看看Weka;它是开源的,Java和主流的
答案 1 :(得分:1)
在http://mahout.apache.org查看Apache Mahout。
答案 2 :(得分:1)
ELKI在自定义距离函数方面非常灵活。您可以将它们插入到几乎所有算法中(例如DBSCAN群集,LOF异常值检测;对于某些算法,例如常规k-Means,它当然没有多大意义。但对于DBSCAN非常有效)。
答案 3 :(得分:0)