我的一个网络应用程序收到了很多文章提交,其中一些写得不是很好。如何创建一个工具来识别“好”与“坏”的写作,仅仅通过提供一系列好的和坏的文章?
请注意,这些文章(至少已经处理过的文章)已经过审核和评分,因此理论上我可以使用这些数字来确认输出。
我没有创建“学习”算法的背景知识,所以即使是指向该主题的基础书籍的指针也会有所帮助,特别是为Python语言编写的。
答案 0 :(得分:1)
我认为这将是一个难以进行的学习算法。但是,如果您确实想要去学习或者只是想了解这个主题,Coursera会提供一些值得一试的免费在线课程。
本课程目前没有针对作业等运行,但您可以在预览模式下观看讲座,从我看到这非常适合初学者: https://class.coursera.org/machlearning-001/lecture/preview
如果你想进行一些练习,那么我强烈建议你看一下Kaggle(http://www.kaggle.com/),它为数据科学/机器学习问题举办公开竞赛。有些比赛甚至都有示例代码可以帮助您入门,但是泰坦尼克号的比赛在Python中有一些示例代码,尽管正在处理的问题比您提出的问题简单得多。