我想将PowerShell或C#中的IIS日志文件(W3C格式)解析为CSV或XLS文件。
我尝试在PowerShell中使用以下代码:
$LogFolder = "C:\iislog\"
$LogFiles = [System.IO.Directory]::GetFiles($LogFolder, "*.log")
$LogTemp = "C:\iislog\end.csv"
# Logs will store each line of the log files in an array
$Logs = @()
# Skip the comment lines
$LogFiles | % { Get-Content $_ | where {$_ -notLike "#[D,F,S,V]*" } | % { $Logs += $_ } }
# Then grab the first header line, and adjust its format for later
$LogColumns = ( $LogFiles | select -first 6 | % { Get-Content $_ | where {$_ -Like "#[F]*" } } ) `
-replace "#Fields: ", "" -replace "-","" -replace "\(","" -replace "\)",""
# Temporarily, store the reformatted logs
Set-Content -LiteralPath $LogTemp -Value ( [System.String]::Format("{0}{1}{2}", $LogColumns, [Environment]::NewLine, ( [System.String]::Join( [Environment]::NewLine, $Logs) ) ) )
# Read the reformatted logs as a CSV file
$Logs = Import-Csv -Path $LogTemp -Delimiter " "
# Sample query : Select all unique users
$Logs | select -Unique csusername
但是此代码不是定界符列,而是将每一行打印到CSV格式的一列中(当使用excel打开end.csv时)。
如何解决此问题?
我希望输出文件中的列彼此分开。
答案 0 :(得分:2)
我在PowerShell中读取这些日志的快速而肮脏的方法使用了自定义函数。通常,这只是使用ConvertFrom-CSV
并处理IIS日志文件格式的前几行以满足cmdlet期望的问题。
function ConvertIISLogFrom-CSV{
[cmdletbinding()]
param(
[parameter(ValueFromPipelineByPropertyName=$true, Mandatory=$true)]
[Alias("FullName")]
[string]$File
)
process{
Get-Content $file | Where-Object{$_ -notmatch "^#[DSV]"} | ForEach-Object{$_ -replace '^#Fields: '} | ConvertFrom-Csv -Delimiter " "
}
}
Get-ChildItem $path -Filter "ex*" |
Sort-Object creationdate -Descending |
Select -Last 1 |
ConvertIISLogFrom-CSV |
Where-Object {$_."cs-username" -eq "username" -and $_."x-fullpath" -like "*error*"} |
Select-Object date,time,"c-ip","cs-username","x-session","x-fullpath" |
Format-Table -AutoSize
该cmdlet将读取一个文件,并有效地删除注释的前几行。我们故意从最初的filterm离开#fields行,因为它包含列标题。在我们刚摆脱#fields之后,我们便获得了正确的CSV格式。
使用上述方法,您只需将$path
更改为包含日志的位置即可。此后的大部分内容是一个示例,显示了与其他PowerShell筛选和cmdlet的集成。
由于我们正在制作PowerShell对象,因此您可以对数据使用任何导出选项。用管道输送到Export-CSV
中,一切顺利。