友 我们正在尝试解决一个只有评论转储的问题,但.csv文件中没有评级。 .csv中的每一行都是由特定产品的客户给出的一个评论,让电视。
在这里,我想将该文本分类为该产品的领域专家给出的下面预定义的类别:
一些评论如下:
现在,通过10个不同客户的10次评论,我如何将它们分类到给定的桶中(您可以通过情感分析调用多标签分类或命名实体识别或信息提取,或者无论如何)
我尝试了所有NLP字频率计数相关的东西(在R中)并引用了StanfordNLP(https://nlp.stanford.edu/software/CRF-NER.shtml)等等。但无法得到具体的解决方案。
有人可以指导我们如何解决这个问题?谢谢!!!
答案 0 :(得分:0)
大多数NLP框架将处理多类分类。 R中的字数本身不太可能非常准确。您可以探索的Python图书馆是Spacy。也可以使用Google,AWS,Microsoft等商业API。每个类别的培训需要相当多的例子。随意发布您的代码以及您看到的问题或性能差距,以获得进一步的帮助。