https://aclanthology.info/pdf/S/S17/S17-2132.pdf
在本文中,描述了SemEval2017共享任务中使用的系统之一,它解释了如何为twitter情绪分析任务实现SVM分类器。
我试图模仿这个系统,但有些部分作为初学者是不可理解的。
它列出了一系列描述单条推文的功能。要实现一个特征向量X(其中一行代表一条推文,而该列包含论文中列出的所有特征值)我应该为每个特征计算向量并在最后连接它吗?
< / LI>其中一个功能是Tf-Idf矢量图。据我所知,Tf-Idf给出了每个文档单词的权重。但在这种情况下,文件是什么?不会使用Tf-idf作为其中一个功能导致最终的X具有不同列数的行?我只是想知道Tf-idf如何在这里作为特征向量之一。
2.8主题和标签功能表示什么?我不太了解它所描述的价值。
任何建议都会很棒!请帮忙!