为什么powershell Regex.Replace吞下换行符?

时间:2013-10-09 15:21:06

标签: regex powershell replace

我有这个脚本在文件上做一些正则表达式替换。我不明白为什么返回的字符串删除了所有换行符?

示例文件内容(UTF-8,每行后有CR-LF):

hello
hello
hello

剧本:

$content = Get-Content "c:\spikes\regexnewline\regexnewline.txt"
Set-Content "c:\spikes\regexnewline\regexnewline-2.txt" $content # test

$content = [regex]::Replace($content, "ll", "yy") #basic replace

Set-Content "c:\spikes\regexnewline\regexnewline-3.txt" $content

当然,文件regexnewline-2.txt是输入文件的精确副本。但是regexnewline-3.txt如何才将其内容放在一行上,最后只有一个CR-LF?

heyyo heyyo heyyo\CR\LF

显然我在这里遗漏了一些东西。有谁能发现它?

顺便说一下,我试过玩regex.Replace并使用带有4个参数的重载,指定RegexOptionsas documented on MSDN,但脚本失败说这个方法没有4个参数重载。 Powershell是否使用不同版本的.Net框架?

1 个答案:

答案 0 :(得分:8)

您看到这个的原因是因为$ content是您最初从文件中读取时的字符串数组。您可以看到任何变量的类型,如下所示:

$content.GetType().FullName

默认情况下,Get-Content返回一个字符串数组,其中每个元素代表一行。当您将该数组传递给.NET的正则表达式替换方法时,PowerShell不会看到一个方法重载,它接受一个字符串数组,但确实看到一个接受字符串的方法,因此它将您的字符串数组强制转换为字符串。如果您在Get-Content调用之后立即执行此操作,则可以看到相同的效果:

"$content"

您甚至可以修改PowerShell在执行此操作时如何连接各个元素:

$OFS = ", "
"$content"

不要使用.NET正则表达式替换,请尝试使用同样处理正则表达式的PowerShell -replace运算符:

$content = $content -replace 'll','yy'