LAS条目的正则表达式

时间:2014-08-27 07:44:01

标签: c# regex

我对RegEx非常不满意。任何人都可以帮助我获得这种模式的RegEx。

这是模式

(单词)。(单个字符,可以为空)(空格)(单词,可以为空):(单词,可以为空)

以下是示例

VERS. 2.00: Ver 2.00
WRAP. NO:
STRT.F                  4501.0000:START DEPTH
WELL. C5 1H:WELL
FTG GTG. :LOCATION FOOTAGE DESCRIPTION

更新1:

这就是我所做的。

string re1 = "((?:[a-z][a-z]+))";   // Word 1
string re2 = ".*?"; // Non-greedy match on filler
string re3 = "(\\.)";   // Any Single Character 1
string re4 = "(.)"; // Any Single Character 2
string re5 = "(\\s+)";  // White Space 1
string re6 = "((?:[a-z][a-z]+))";   // Word 2
string re7 = ".*?"; // Non-greedy match on filler
string re8 = "(:)"; // Any Single Character 3
string re9 = ".*?"; // Non-greedy match on filler
string re10 = "(?:[a-z][a-z]+)";    // Uninteresting: word
string re11 = ".*?";    // Non-greedy match on filler
string re12 = "((?:[a-z][a-z]+))";  // Word 3

Regex r = new Regex(re1 + re2 + re3 + re4 + re5 + re6 + re7 + re8 + re9 + re10 + re11 + re12, RegexOptions.IgnoreCase | RegexOptions.Singleline);

更新2:

好。我尝试了一些新的东西。这是我的正则表达式。

(\.)(.)(\s+)(4501.0000)(:)

这是输入。

STRT DTG.F                  4501.0000:START DEPTH

这是输出。

STRT DTG
.
F

4501.0000
:
START DEPTH

现在我只需要用正则表达式替换4501.0000(例如"一些文字"或者#34;一些更多的文字"),

2 个答案:

答案 0 :(得分:2)

LAS文件的标题部分(通常)具有这种格式。

<MNEM> .<UNIT> <DATA> : <DESCRIPTION>

正则表达式可以是这样的。

^([\w\s]*)\s*\.([^ ]*)\s*([^:]*)\s*:(.*)$

解释

^         -> beginning of line
([\w\s]*) ->   1st group, MNEM (take words and/or space)
\s*       -> space
\.        -> period delimiter
([^ ]*)     ->   2nd group, UNIT (take everything until it sees space)
\s*       -> space
([^:]*)   ->   3rd group, DATA (take everything until it sees colon)
\s*       -> space
:         -> colon delimiter
(.*)      ->   4th group, DESCRIPTION (take everything)
$         -> end of line

DEMO

答案 1 :(得分:0)

使用      \ s或&#34; &#34; 也包括空格。 像

这样的东西
     ((?:[a-z][a-z\s]+))

      ((?:[a-z][a-z ]+))