用于情感识别的分类数据集

时间:2013-11-02 17:12:07

标签: opencv csv dataset machine-learning sentiment-analysis

我参与一些研究教育任务,需要具有分类面部情绪的数据集来训练分类器。例如,性别分类很简单:我可以创建csv文件,并根据性别标记图像为0或1的任何文件。像这样:

... / .. / male.jpg:1

... / .. / female.jpg:0
... ...

所以,我需要类似的东西,但面部情绪分类。我找到了带有关键点的图像数据集,因此我可以通过不同的情感对它们进行聚类,但如果之前手动标记它将会更准确。也许有人有直接的课程,或链接与这样的信息。谢谢。

2 个答案:

答案 0 :(得分:0)

这很棘手,因为即使是人类,情绪也没有独特的特征。但是有些学者已经麻烦地准备了你想要的监督数据,也就是说你可以联系下面的作者并询问他们的数据集:

“我们引入了两个大型数据库,包括75万和120万缩略图大小的图像,标有情感相关的关键字。” Solli和Lenz,Linkoping大学,Norrkoping,瑞典。

答案 1 :(得分:0)

Twitter通常是开始情绪分析的好地方,因为它在高级搜索中提供了筛选正面和负面推文的可能性。

您可以在此处查看:https://twitter.com/search-advanced

如果你想这样做,你需要编写一些代码来使用twitter API,如下所示: https://dev.twitter.com/docs/using-search

如果您愿意,可以使用API​​: https://dev.twitter.com/console

结果以json的形式返回。 通常就足够了!

您只需将每条推文与相应的情绪相关联即可。

如果你想要一个更“原子”的数据集,你可以根据它在正面和负面类中出现的频率来计算每个单词的分数,并使用tf-idf方法进行标准化。

请注意,如果您想构建更高级的分类器,您还需要处理“中性”情绪,这不是Twitter提供的。