我是文本挖掘的新手,并尝试使用R来解决这个问题。
我的数据集如下所示:
Col 1: Item Description (Text that I need to mine) ||
Col 2: Item category ||
Col 3: Item Sub Category
我需要得到的输出应该是这样的:
Topic || Keyword 1 || Keyword 2 || Keyword 3 ... Keyword 10
Category A || Fitness || Beauty ........
Category B || .....
Sub Category AZ ||
Sub Category AY ||
基本上我需要为每个类别和子类别获得前10个关键字。
最好的方法是什么?
我为我对R的不了解而道歉。我也愿意考虑使用其他开源工具来执行此操作。
提前致谢。