我手头的问题有点困难
我有一个相当大的数据库,以一种非常复杂的html格式存储,但我设法将其转换为更简单,更易于使用的纯文本格式。
现在的格式如下:
'Owner' FakeOwner 'Thread' FakeOwner and FakeRespondant 'Message' This is a short Message 'Date' Tuesday, 28 January 2014 at 08:49 UTC+11
然后问题就是将其转换为可用的格式,最好是csv。主要困难在于,对于具有数据库中的列的每一行,我无法预测它将出现的顺序。
e.g。
'Owner' Andrew 'Owner' Nathan 'Thread' Andrew and Alex 'Message' Fake Message
但是,我可以说它总是将列的行交替到值,如上所示。 (虽然有些'值'只是行尾符号。[\ n,不是\ r \ n]
样品:
“所有者”
编辑名称
“线”
编辑名称,编辑名称
“用户”
编辑名称
“日期”
2014年1月28日星期二08:49 UTC + 11
'消息'
'用户'
编辑名称
“日期”
2014年1月28日星期二08:50 UTC + 11
“消息”
这是一条消息。