从字符串行中删除空格并在数组中使用它

时间:2016-05-16 16:38:52

标签: powershell powershell-v2.0

我正在查看旧帖子,但我找不到具体的答案如何替换字符串中的空格然后将其用作数组。

输入文件包含以下行:

-rw-r--r--   1 myuser admin   315279199 May 12 02:46 2016_05_12_backup.tar.gz
-rw-r--r--   1 myuser admin   315278122 May 13 04:56 2016_05_13_backup.tar.gz

我想收到以下输出:

program executed on 2016-05-16 / 12:18:06
to unix: 
rm -fr 2016_05_12_backup.tar.gz
rm -fr 2016_05_13_backup.tar.gz


to excel log: 
2016_05_12_backup.tar.gz
2016_05_13_backup.tar.gz

=============== END  ==============

我的代码在这里:

$path_in = "C:\test\input.txt"
$path_out = "C:\test\output.txt"

$endMessage = "=============== END  =============="

$reader = [System.IO.File]::OpenText($path_in)
$get_time_message = "program executed on " + [datetime]::now.ToString('yyyy-MM-dd / HH:mm:ss')

try {

add-content $path_out $get_time_message
add-content $path_out "to unix: "

$long_string_to_excel =""


    while($true){
        $line = $reader.ReadLine()

        if ($line -eq $null) { break }

        # divide the input line into array - remove white space 
        # it is hard coded here below for the lines that consist two and three space characters

        $better_line =  $line.replace('   ',' ')
        $best_line = $better_line.replace('  ',' ').split(' ')

        $stringToOutput = "rm -fr " + $best_line[8]

        $long_string_to_excel = $long_string_to_excel + $best_line[8]  + "`r`n"

        add-content $path_out $stringToOutput

    }

    add-content $path_out "`n"
    add-content $path_out "to excel log: "
    add-content $path_out $long_string_to_excel
    add-content $path_out $endMessage

}
finally {
    $reader.Close()
}
write-host "program execution:`ncompleted"

此脚本可以正常工作,但对于包含两个和三个空格字符的输入行,它是“硬”编码的。我想用

    $better_line =  $line.replace(' +', ' ');
    $best_line = $better_line.split(' ')

而不是

    $better_line =  $line.replace('   ',' ')
    $best_line = $better_line.replace('  ',' ').split(' ')

但结果不正确:

program executed on 2016-05-16 / 12:18:04
to unix: 
rm -fr 315279199
rm -fr 315278122


to excel log: 
315279199
315278122

=============== END  ==============

请问您如何更换硬编码部分的解决方案,以便脚本适用于单行中的任何类型的空白区域?

2 个答案:

答案 0 :(得分:4)

使用内置-split operator代替静态String.Split()方法 - 它支持正则表达式,因此您可以使用它来分割“1个或更多个空格”,例如:

PS C:\> "a   b" -split '\s+'
a
b
PS C:\> "a b" -split '\s+'
a
b

答案 1 :(得分:2)

如何在PowerShell中从数组中删除空项:

直观方法:检查数组中的每个项目并验证它是否为空

    $best_line = $line.split(' ') | ? {$_}

讨论(.NET)方法:String.Split Method (String[], StringSplitOptions)

    $best_line = $line.split(' ',[System.StringSplitOptions]::RemoveEmptyEntries)
  

输入:System.StringSplitOptions

     
      
  • StringSplitOptions.RemoveEmptyEntries从返回的数组中省略空数组元素;或
  •   
  • StringSplitOptions.None在返回的数组中包含空数组元素。
  •