我正在使用RapidMiner 5.3.013。我正在阅读一份excel文件,里面有来自Remedy的数千行工作日志。我想基于正则表达式^[A-Z][\w\d/?(# ]+[\w0-9#)]{2}:
删除文本,然后使用数据处理文档。到目前为止还没有想出如何做到这一点。我可能只是写VBA,但想知道如何在Rapidminer中完成。
答案 0 :(得分:0)
读取Excel数据后,请确保Process Documents操作符要处理的字段设置为text type。使用Nominal to Text运算符执行此操作。在流程文档循环中,使用Tokenize运算符将数据拆分为标记。使用“过滤器标记”运算符可以删除任何不需要的标记。此运算符将正则表达式作为参数。确保在此运算符上设置了反转标志,以删除您不想要的标记而不是保留它们