我正在使用HUNK 6.1.1。我在csv文件中有以下格式的数据,
描述= ABC
MyID = 001
MyCount = 95
TimeStamp:2013-07-03T04:14:38
All_Info = [FREE_TEXT]最后更新:11-07-13 00:02:49重置日期:10-05-09 00:31:26测试时间:30.316秒测试计数器:1181.0
我通过使用csv loader创建一个简单的提供者和索引来加载我的HDFS位置的数据,但我想进一步解析“All_Info”字段以提取字段值(上次更新,重置日期,测试时间和放大器) ;测试计数器)。 “All_Info”列没有特定的分隔符。
如何进一步解析“All_Info”字段,以便我可以使用其中的字段值来生成这些字段的聚合?