我有点困惑,因为关于深度学习这个话题。
我的问题:让我们假设有一个要解决的任务。应该使用Keras深度学习模型将评论分为正面还是负面。
现在:此任务属于监督学习还是无监督学习?为什么?深度学习和神经网络在这里如何工作?他们如何学习?如果将机器学习算法用于此任务会更好吗?
答案 0 :(得分:1)
监督学习是机器学习任务,它学习基于示例输入输出对将输入映射到输出的功能。它从标记的训练数据(由一组训练示例组成)中推断出功能。在监督学习中,每个示例都是一对,由输入对象(通常是矢量)和期望的输出值(也称为监督信号)组成。一种监督学习算法,对训练数据进行分析,并产生一个推断函数,可用于映射新实例。
无监督学习是一种机器学习算法,用于从没有标签响应的输入数据组成的数据集中得出推论。最常见的无监督学习方法是聚类分析,它用于探索性数据分析以发现隐藏的模式或数据分组。
(维基百科和mathworks的定义)
您提到的任务已经有标记的数据集(每个输入都有实际的评论),因此您始终可以将其建模为监督学习问题,并使用SVM,Random Forest或MLP等机器学习模型来进行建模解决任务。
https://www.kaggle.com/c/sentiment-analysis-on-movie-reviews/data
https://www.kaggle.com/snap/amazon-fine-food-reviews
https://www.kaggle.com/jessicali9530/kuc-hackathon-winter-2018
https://www.kaggle.com/nicapotato/womens-ecommerce-clothing-reviews
https://www.kaggle.com/utathya/imdb-review-dataset
https://www.kaggle.com/datafiniti/hotel-reviews
https://www.kaggle.com/sid321axn/amazon-alexa-reviews
https://www.kaggle.com/bittlingmayer/amazonreviews
https://www.kaggle.com/lakshmi25npathi/imdb-dataset-of-50k-movie-reviews