标签: clustering-key
Hy,我正在研究基于产品评级情绪分析的项目。 我有数据集用于好词和否定词。当任何用户对产品网站发表评论时,它将自动评分为10分 所以我与聚类技术混淆,之前解决了我的问题 Plzzx帮助 在此先感谢。
答案 0 :(得分:1)
您基本上问我们什么是最适合您作为程序的分类器,同时我们必须知道您的数据是如何存储的。
然而,似乎你只有两个类,正面和负面。并且您希望基于数据的单词分析对新数据进行分类。
我之前在这个问题上工作过,我使用Rocchio的TF-IDF算法进行此类分类。你给它一组训练数据(负面和正面的单词),然后对后来的系统进行分类。
它基于矢量分类和余弦相似距离测量。
有关详细信息,请参阅此paper。 您可以找到该方法如何工作的示例(在非常小的数据上)here。
注意:提供的示例是我工作的项目的一部分。