我想对文字进行情感分类(来自社交媒体的帖子,例如推文,facebook墙贴,youtube评论等......)。虽然我找不到带有注释数据的良好数据集。我正在寻找的不只是带有正面和负面注释的数据。我正在寻找一个有几种情绪的数据集。这可以是或离散值(ekman 6基本情绪)或持续值(唤醒 - 效价模型)。有谁知道我可以在哪里获得这样的数据集,这可以来自Twitter,Facebook,Myspace ......只要它来自社交网络
答案 0 :(得分:1)
好吧,我认为更好的名字(或更经常使用)会是情感分析(情感分类) - 对吗?我不确定社交媒体是否提供他们的私人数据(可能是其中的一部分)。无论如何,我发现了这篇论文:
http://www.cs.cornell.edu/home/llee/papers/sentiment.pdf
他们正在处理来自http://www.cs.cornell.edu/people/pabo/movie-review-data/的数据:https://groups.google.com/forum/?fromgroups#!aboutgroup/rec.arts.movies.reviews。
适合你吗?基本上,找到适当的数据通常是ML中的一个大问题。通常需要建立自己的(我的意思是手动分类它的一部分并在之后应用一些聚类或半监督学习)
如果您在网络上找不到合适的内容,我会尝试联系一些撰写与您的研究类似的文章的作者。也许他们已经创建了适合你的数据集......