从文本数据框中提取名词和动词,并将其保存在R中的两个不同的数据框中

时间:2015-06-18 17:37:33

标签: r text dataframe extract text-analysis

我有一个只有文本列的文本数据框。其中一列是

  hw motorola扫描仪型号rssn缺失问题损坏电源连接序列提供扩展部件编号fsr =短电缆附加腕部构建类型rpcolleague colin patterson联系号码确保选择主仓库ID确保选择正确的型号位置ID保存日志

我已从文字中删除了数字,停用词和标点符号。我想将名词和动词分开并将它们放在不同的数据框中。

1 个答案:

答案 0 :(得分:0)

这不是一项严格的琐碎任务。你可以加载一个带有每个单词的词性的库(例如OpenNLP - > Maxent_POS_Tag_Annotator),但是其中一些可能是一个词性或另一个词取决于上下文,所以这使得这更难以编程方式完成任务。希望OpenNPL包能够提供帮助。