关于Twitter情感分析任务中推特特征向量的问题。

时间:2017-12-06 11:38:05

标签: machine-learning nlp

https://aclanthology.info/pdf/S/S17/S17-2132.pdf

在本文中,描述了SemEval2017共享任务中使用的系统之一,它解释了如何为twitter情绪分析任务实现SVM分类器。

我试图模仿这个系统,但有些部分作为初学者是不可理解的。

  • 它列出了一系列描述单条推文的功能。要实现一个特征向量X(其中一行代表一条推文,而该列包含论文中列出的所有特征值)我应该为每个特征计算向量并在最后连接它吗?

    < / LI>
  • 其中一个功能是Tf-Idf矢量图。据我所知,Tf-Idf给出了每个文档单词的权重。但在这种情况下,文件是什么?不会使用Tf-idf作为其中一个功能导致最终的X具有不同列数的行?我只是想知道Tf-idf如何在这里作为特征向量之一。

  • 2.8主题和标签功能表示什么?我不太了解它所描述的价值。

任何建议都会很棒!请帮忙!

0 个答案:

没有答案