需要分析约5万篇文章,并且需要在帖子后创建标记模式字典,这将成为我们计划为网站构建的自动标记功能的基础。
是否有任何工具可用于标记数据并帮助生成数据集中可用数据类型的列表。
如果没有,那么什么是开始的好地方?
答案 0 :(得分:0)
有一个名为Weka的数据挖掘工具,您可以尝试下载它。 youtube上有很多weka视频。你也可以谷歌搜索有很多可用信息。
答案 1 :(得分:0)
用于数据分析的工具很少,您可以在youtube上观看视频以了解其中一个。 1)Weka,KNIME-如果你擅长Java,那么你应该去做。 2)Orange,NLTK-如果你擅长python,你可以选择这个。 3)R编程 - 如果你擅长C,那么你可以去做。