分类语言变量

时间:2019-10-24 10:58:35

标签: r classification linguistics

我正在尝试将有关工作的语言变量归类为最相似的类别(没有类别变量,因此我想我可以使用PMI或RAKE提取来自工作变量的最常用词)

问题是作业变量是一个免费的冠军,因此您可以编写任何内容,因此无论如何都需要清洗。并且行中包含诸如“销售助理,响应者”之类的内容,因此有必要添加一些规则,使规则在“销售助理”中比在“响应者”中更重要,并分配给该工作,即“销售助理”的类别

我正在考虑神经网络或决策树,它可以工作吗?怎么办?

0 个答案:

没有答案