我想使用PowerShell将PDF文件的内容复制到文本文件中。我能够使用下面的代码解析PDF的内容,但我不知道如何将解析的数据复制到文本文件中。
Add-Type -Path .\itextsharp.dll
$reader = New-Object iTextSharp.text.pdf.pdfreader -ArgumentList "$pwd\test.pdf".
for ($page = 1; $page -le $reader.NumberOfPages; $page++) {
$lines = [char[]]$reader.GetPageContent($page) -join "" -split "`n"
foreach ($line in $lines) {
if ($line -match "^\[") {
$line = $line -replace "\\([\S])", $matches[1]
$line -replace "^\[\(|\)\]TJ$", "" -split "\)\-?\d+\.?\d*\(" -join ""
}
}
}
答案 0 :(得分:0)
最简单的方法是将for
循环的输出分配给变量,然后将其写入文件:
$data = for ($page = 1; $page -le $reader.NumberOfPages; $page++) {
...
}
$data | Out-File 'C:\path\to\your.txt' -Encoding UTF8