重复组中的标题

时间:2008-09-23 18:21:40

标签: .net regex

我正在解析具有标题的文本,然后解析适用于该标题的数据。我需要将每个数据字段分成几组,并将标题也适用于这些组。这是一个例子:

(更新:以下文字已更新,以更好地反映其当前布局,并指示注释。)

Heading 1
Heading 2      Heading 3
(Group 1)
data1 data2 
data3 data4 
data5 
(Group 2)
data1 data2 
data3 data4 
data5
(Group 3) 
data1 data2 
data3 data4
data5
** The headers become different values here *** (this is not part of the data)
NewHeading 1
NewHeading 2      NewHeading 3
(Group 4)
data1 data2 
data3 data4 
data5 
(Group 5)
data1 data2 
data3 data4 
data5
**etc

输出应该是这样的:

(Group 1) Heading1 Heading2 Heading3 data1 data2 data3 data4 data5
(Group 2) Heading1 Heading2 Heading3 data1 data2 data3 data4 data5
(Group 3) Heading1 Heading2 Heading3 data1 data2 data3 data4 data5
(Group 4) NewHeading1 NewHeading2 NewHeading3 data1 data2 data3 data4 data5
(Group 5) NewHeading1 NewHeading2 NewHeading3 data1 data2 data3 data4 data5

标记的字段(组1-5)只是该行的标签,它们并不属于返回集的一部分。更改为“NewHeading”的标题仅表示标题值已更改,应应用于其后的数据。

在过去的几个小时里,我已经做了一些阅读,寻找这个叫做什么,但我没有运气。有任何想法吗?这是针对.Net正则表达式引擎的。

更新:添加了注释,并显示标题更改了文件。 我也做了一些研究,并相信通过两种模式我可以轻松地完成一些事情。一个用于标题,一个用于数据。然后我可以将标题和数据匹配索引(即:在文件中找到它的位置)相互比较,然后将它们组合起来。

1 个答案:

答案 0 :(得分:2)

1)逐行循环。这不是正则表达式的地方

2)你真的需要澄清你的问题。目前尚不清楚(第1组)和**这里的标题是否有所不同**是您输入的一部分,或者您是否在注释它。