我从excel表中的数据库中提取了大学位置数据。我需要对公司提供的职位描述进行文本处理,这是所有行的描述性字段,然后提出需求分析。 这是数据的快照
有人可以帮我开始这项活动吗?
由于 SAURABH
答案 0 :(得分:1)
我不是数据专家,但我有一些数据挖掘经验。我会为初学者尝试以下步骤:
Excel不适用于此类分析。找一些专用于数据挖掘的工具,例如RStudio。 R有许多有用的数据挖掘开箱即用算法。
清理数据,例如所有文本为小写,删除停用词,删除标点符号,删除其他空格。
对数据进行标记,例如1个单词代币 - "财务","单身汉"
决定如果需要某个配置文件,您将如何断言?如果通过个人资料,您的意思是您需要更频繁地出现在数据中出现的某些令牌频率的信息, " finance"," bachelor"然后简单地创建一个频率矩阵。 R允许您创建此可视化 - Word云。
这是为了让你开始:)。我相信在这件事上还有更多的建议。