我正在尝试使用机器学习来创建二进制分类器,并且正在尝试使用具有的相关特征(数字属性)为数据开发其他特征。我进行了很多搜索,但找不到与我一起使用的代码块。 我该怎么办?
我已经搜索了减少维数的方法,并找到了库(多元统计),但实际上我不理解,我感到迷:了:D
答案 0 :(得分:1)
没有人会为您做出选择哪种确切方法的选择。它们有很多很多不同的方式来进行二进制分类和特征提取。如果您对诸如Multivariate Statistics之类的库提供的所有这些名称感到不知所措,那么请看一本有关统计和机器学习的教科书,了解方法与编程语言无关。
从一些简单的方法开始,例如主要成分分析(PCA),(MultivariateStats.jl提供了此方法),然后在您对数据和方法有了更多知识时进行测试。
一些Julia库可以查看:JuliaStats(https://github.com/JuliaStats)及其各个部分
对于神经网络,有Flux.jl和KNet.jl
对于Clustering,有Clustering.jl
然后,还绑定了python库Tensorflow(神经网络及其他)和Scikit-Learn(各种ML算法)
还有更多项目,但是我认为这些项目很重要。