我需要知道如何将文本文件中的字符串转换为数据帧以进行分析。
我得到了一行,每个客户都有一个ID,该行的标题和值都在其中,并用半冒号';'分隔。 例如:
{ID=12345;TimeStamp=""2019-02-26 00:15:42"";Event=StatusEvent;Status=""WiLoMonitorStart"";Text=""mnew inactivity failure on cable"";}
列标题是ID,时间戳,事件,状态,文本以及等号之前的所有其他字符。
列标题下的值将在等号“ =”之后,参见图片,这是我想要获得的最终结果。
Statements {
"{ID=12345;TimeStamp=""2019-02-26 00:15:42"";Event=StatusEvent;Status=""WiLoMonitorStart"";Text=""mnew inactivity failure on cable"";}"
"{ID=12346;TimeStamp=""2019-02-26 00:15:43"";Event=StatusEvent;Status=""MetroCode"";Text=""AU"";}"
"{ID=12347;TimeStamp=""2019-02-26 00:15:43"";Event=StatusEvent;Status=""LoWiValidation"";Text=""Password validation 2.5GHz for AES: BigBong"";}"
"{ID=12349;TimeStamp=""2019-02-26 00:15:42"";Event=DomainEvent;MacAddress=""AB:23:34:EF:YN:OT"";LogTime=""2019-02-26 00:15:48"";Domain=""Willing ind"";SecondaryDomain=""No_Perl"";}"
"{ID=12351;TimeStamp=""2019-02-26 00:15:45"";Event=CollectionCallEvent;SerialNumber=""34121"";}"
"{ID=12352;TimeStamp=""2019-02-26 00:15:46"";Event=CollectionCallEvent;SerialNumber=""34151"";Url=""werlkdfa/vierjwerret/vre34f3/df343rsdf343+t45rf/dfgr3443"";}"
}
}
您可以看到半冒号“;”分隔每个变量,有人可以分隔并使R识别关于客户ID(主键)的列标题是什么,以及将放在相应标题下的值是什么。
请注意,每一行的下一个标题可能都不相同。
提供的图像最终是我想要实现的,但是在R中我很难做到。它不是json文件或XML格式,而是以我需要的文本格式转储的文件在我获得任何见解之前,先提取并分析数据框格式的信息。
有什么建议吗?是否有比使用正则表达式更好的方法?例如。 字符串包?