标签: cluster-analysis rapidminer
我的流程是(来自文件的处理文档 - > K-Means聚类)。 “文件夹视图”群集结果仅显示每个群集中的文件名。
问题: 1)如何组织过程来显示文本文件的内容而不是文件名?我的文字很短。如何导出该视图? 2)如何组织流程从单个文件中逐行读取文档(每个文本行是文档)而不是“从文件中处理文档”?
此致
答案 0 :(得分:1)
如果您在keep text运算符上设置了Process Documents复选框,则原始文本将与对应于标记化文本的属性一起使用。
keep text
Process Documents