我发现学习新主题最好用一个简单的代码实现来获得想法。这就是我学习遗传算法和遗传编程的方法。什么是一些很好的入门程序来开始机器学习?
最好让任何引用的资源可以在线访问,以便社区可以受益
答案 0 :(得分:12)
您将使用哪种语言?如果你很灵活,我推荐Matlab,python和R作为好人选。这些是用于开发和评估算法的一些常用语言。它们有助于快速算法开发和评估,数据处理和可视化。大多数流行的ML算法也可用作库(带源)。
我首先关注R2中的基本分类和/或聚类练习。它更容易可视化,通常足以探索ML中的问题,如风险,类不平衡,嘈杂标签,在线与离线培训等。从日常生活中创建数据集,或者您感兴趣的问题。或者使用像Iris数据集一样经典,因此您可以将您的进度与已发表的文献进行比较。您可以在以下位置找到Iris数据集:
它的一个很好的特点是它有一个类'setosa',可以很容易地与其他类线性分离。
一旦选择了几个有趣的数据集,首先要实现一些标准分类器并检查它们的性能。这是一个很好的分类器列表:
使用Iris数据集和我提到的其中一种语言,您可以轻松地使用任何分类器进行小型研究(几分钟到几小时,具体取决于您的速度)。
编辑:你可以谷歌“虹膜数据分类”找到很多例子。以下是Mathworks使用Iris数据集的分类演示文档:
答案 1 :(得分:4)
我认为你可以为垃圾邮件过滤编写一个“Naive Bayes”分类器。 你可以从这本书中获得很多信息。
http://nlp.stanford.edu/IR-book/information-retrieval-book.html
答案 2 :(得分:1)
决策树。它经常用于分类任务,并有很多变种。 Tom Mitchell的书是实现它的一个很好的参考。
答案 3 :(得分:1)
神经网络可能是最容易实现的东西,它们在整个文献中都得到了相当全面的介绍。
答案 4 :(得分:-9)
有一种叫书的东西;你熟悉那些吗?二十年前我在探索人工智能时,有很多书。我想现在互联网存在,书籍陈旧,但你可以在一个古老的图书馆找到一些。