应用错误收集

时间：2013-06-24 14:04:35

标签： python machine-learning corpus

我的一个网络应用程序收到了很多文章提交，其中一些写得不是很好。如何创建一个工具来识别“好”与“坏”的写作，仅仅通过提供一系列好的和坏的文章？

请注意，这些文章（至少已经处理过的文章）已经过审核和评分，因此理论上我可以使用这些数字来确认输出。

我没有创建“学习”算法的背景知识，所以即使是指向该主题的基础书籍的指针也会有所帮助，特别是为Python语言编写的。

答案 0 :(得分：1)

我认为这将是一个难以进行的学习算法。但是，如果您确实想要去学习或者只是想了解这个主题，Coursera会提供一些值得一试的免费在线课程。

本课程目前没有针对作业等运行，但您可以在预览模式下观看讲座，从我看到这非常适合初学者： https://class.coursera.org/machlearning-001/lecture/preview

如果你想进行一些练习，那么我强烈建议你看一下Kaggle（http://www.kaggle.com/），它为数据科学/机器学习问题举办公开竞赛。有些比赛甚至都有示例代码可以帮助您入门，但是泰坦尼克号的比赛在Python中有一些示例代码，尽管正在处理的问题比您提出的问题简单得多。