Question

我有一个包含以下布局的文本文件，

Lorem Ipsum Lorem Ipsum Ipsum user:john
Lorem Ipsum user:peter
Lorem Ipsum Lorem Ipsum user:george
Lorem Ipsum user:john
Lorem Ipsum  vLorem Ipsum user:george
Lorem Ipsum user:john

我必须在Powershell V2上开发一个脚本来计算事件并构建一个包含以下内容的CSV，

john,3
george,2
peter,1

我计划通过文件循环，将每个用户保存在一个数组中，然后使用get-content和一个模式计算出现次数，例如：

#assumming i was able to fill the array in some way :)
$users =@('john','peter', 'george')
for each ($user in $users)
{
     $count = get-content .\myfile.txt | select-string -pattern "user:$user"
     write-host $count
}
#save the CSV

有意义吗？我很满意你的提示和技巧。了解Powershell的强大功能我非常喜欢用户，这是一种更好的方法。谢谢！

Answer 1

使用您当前的方法，您将为每个用户从磁盘读取一次文件。扫描文件一次可能会更好，并且一次性收集所有用户。

听起来你提前没有用户列表，你基本上需要扫描像user:<username here>这样的字符串，并保持你找到的不同用户名的运行记录。

这是一个应该完成基本工作的功能：

function GetUserCounts($fileName)
{
  $userCounts = @{}

  switch -regex -file $fileName
  {
    '\buser:([a-zA-Z]+)\b' {
       $userName = $matches[1]
       $userCounts[$userName] = [int]$userCounts[$userName] + 1
    }
  }

  $userCounts.GetEnumerator() | select Name,Value
}

那么你可以像这样创建一个CSV：

PS> GetUserCounts .\myfile.txt | Export-Csv .\counts.csv

Answer 2

以下是使用Group-Object cmdlet的另一个选项：

Get-Content lorem.txt | 
Foreach-Object {$_ -replace '^.+user:(.+)$','$1' } | 
Group-Object -NoElement

Powershell，计算文本文件中的字符串出现次数

2 个答案: