如何在VBScript RegEx中替换换行符

时间:2018-02-13 04:34:38

标签: regex replace vbscript substitution metacharacters

我正在使用VBScript并拥有一个将xml转换为文本文件的脚本。

我正在尝试替换将字符串###EntryEnd###\|替换为 LF 字符。

我在替换模式中尝试\n\x0a,但他们无法正常工作。我找到的唯一解决方法是使用Chr(10)代替。

我一直在寻找这种行为的答案,因为无法找到它。 \n\x0a都应该有用。有什么建议吗?

以下是代码:

' Method to process the file
Private Function PrepFile(ByVal strInp)
    With New RegExp
        .Global = True
        .Pattern = "\|"
        strInp = .Replace(strInp, "")
        .Pattern = "<xmldoc .*?xml:lang=""([^""]+)"">"
        strInp = .Replace(strInp, "English|$1|Part Of Speech|Note|EngDef|Glossary Definition###EntryEnd###|")
        .Pattern = "<remove>.*?</remove>"
        strInp = .Replace(strInp, "")
        .Pattern = "(<tab/>|</para>)"
        strInp = .Replace(strInp, "|")
        .Pattern = "<[^>]*>"
        strInp = .Replace(strInp, "")
        .Pattern = "\n"
        strInp = .Replace(strInp, "")
        .Pattern = "###EntryEnd###\|"
        strInp = .Replace(strInp, chr(10))
    End With
    PrepFile = strInp
End Function

示例文件摘要:

<?xml version="1.0" encoding="UTF-8"?>
<xmldoc source="" type="TERMS" xml:lang="hu-HU">
<para id="13" name="Entry"><notrans><seg>School Administrator</seg><tab/></notrans><remove>___________</remove><seg>iskolavezető</seg></para>
<para id="14" name="Usage"><notrans><seg> </seg><tab/></notrans><remove>HASZNÁLAT:</remove><seg> </seg></para>
<para id="15" name="EntryText"><notrans><seg> </seg><tab/></notrans><remove>MEGHATÁROZÁS:</remove><seg> </seg></para>
<para id="16" name="Context"><remove>PÉLDA:</remove><remove><seg>Cathy Brown iskolavezető</seg></remove><notrans>###EntryEnd###</notrans></para>
<para id="17" name="Entry"><notrans><seg>School Resource Officer</seg><tab/></notrans><remove>___________</remove><seg>iskolarendőr</seg></para>
<para id="18" name="Usage"><notrans><seg> </seg><tab/></notrans><remove>HASZNÁLAT:</remove><seg> </seg></para>
<para id="19" name="EntryText"><notrans><seg>a law enforcement officer who is responsible for providing security and crime prevention services in schools in parts of the United States and Canada.|</seg><tab/></notrans><remove>MEGHATÁROZÁS:</remove><seg>rendőr, aki azért felelős, hogy az iskolákban biztonsági és bűnmegelőzési feladatokat lásson az Egyesült Államok és Kanada egyes területein.</seg></para>
<para id="20" name="Context"><remove>PÉLDA:</remove><remove><seg>Ocalai iskolarendőrök</seg></remove><notrans>###EntryEnd###</notrans></para>
</xmldoc>

1 个答案:

答案 0 :(得分:1)

在你的问题中,&#34;问题&#34; (只是错误的假设)可以在

中找到
  • \n\x0a都可以使用

Replace方法的documentation并未声明替换字符串允许使用除$1$2之外的转义序列,...引用正则表达式模式中的捕获组。

因此,如果RegExp对象在替换字符串中没有提供此行为,并且由于VBScript解析器不处理字符串中除转义加倍引号之外的任何转义序列,则没有任何元素处理{{ 1}}到换行转换。

您可以使用指示的转义序列来表示搜索模式字符串中的非打印字符,但它们在替换字符串中不会被视为转义序列。

如果您不喜欢\n函数调用,则可以使用可用的Chr(10)常量来引用换行符

vbLf