如何将具有标题和每个字符串具有ID的值的字符串转换为R

时间:2019-03-09 04:28:09

标签: r dataframe

我需要知道如何将文本文件中的字符串转换为数据帧以进行分析。

我得到了一行,每个客户都有一个ID,该行的标题和值都在其中,并用半冒号';'分隔。 例如:

{ID=12345;TimeStamp=""2019-02-26 00:15:42"";Event=StatusEvent;Status=""WiLoMonitorStart"";Text=""mnew inactivity failure on cable"";}

列标题是ID,时间戳,事件,状态,文本以及等号之前的所有其他字符。
列标题下的值将在等号“ =”之后,参见图片,这是我想要获得的最终结果。

Statements {    
    "{ID=12345;TimeStamp=""2019-02-26 00:15:42"";Event=StatusEvent;Status=""WiLoMonitorStart"";Text=""mnew inactivity failure on cable"";}"
    "{ID=12346;TimeStamp=""2019-02-26 00:15:43"";Event=StatusEvent;Status=""MetroCode"";Text=""AU"";}"
    "{ID=12347;TimeStamp=""2019-02-26 00:15:43"";Event=StatusEvent;Status=""LoWiValidation"";Text=""Password validation 2.5GHz for AES: BigBong"";}"
    "{ID=12349;TimeStamp=""2019-02-26 00:15:42"";Event=DomainEvent;MacAddress=""AB:23:34:EF:YN:OT"";LogTime=""2019-02-26 00:15:48"";Domain=""Willing ind"";SecondaryDomain=""No_Perl"";}"
    "{ID=12351;TimeStamp=""2019-02-26 00:15:45"";Event=CollectionCallEvent;SerialNumber=""34121"";}"
    "{ID=12352;TimeStamp=""2019-02-26 00:15:46"";Event=CollectionCallEvent;SerialNumber=""34151"";Url=""werlkdfa/vierjwerret/vre34f3/df343rsdf343+t45rf/dfgr3443"";}"
}   

}

enter image description here

您可以看到半冒号“;”分隔每个变量,有人可以分隔并使R识别关于客户ID(主键)的列标题是什么,以及将放在相应标题下的值是什么。

请注意,每一行的下一个标题可能都不相同。

提供的图像最终是我想要实现的,但是在R中我很难做到。它不是json文件或XML格式,而是以我需要的文本格式转储的文件在我获得任何见解之前,先提取并分析数据框格式的信息。

有什么建议吗?是否有比使用正则表达式更好的方法?例如。 字符串包?

0 个答案:

没有答案