标签: data-analysis
任何人都可以建议一种方法来处理信息并分析用户在我网站上的文章发布的评论中的数据。
我确实想要按如下方式处理评论:
示例:与关于计算机化的文章一样,可能会收到以下评论:
我如何处理这些信息 - :我接受评论并尝试识别其中的一些预定义[和可扩展]关键字。
答案 0 :(得分:1)
假设您正在尝试从评论中提取一些有用的信息,您可以将一些机器学习应用于评论,以对内容中包含的数据进行分类或分类,等等。
您可以对文本进行多种不同类型的学习,但我个人建议使用支持向量机或朴素贝叶斯分类器来分类和分析注释。您也可以使用群集,但在您选择的解决方案中需要有自然语言处理元素。您可以使用许多不同的库来实现要使用的代码,例如svmlight,javaml等。我个人使用过javaml,它是一个很好的库。