如何将PDF文件的解析内容写入文本文件?

时间:2015-05-28 06:06:34

标签: powershell pdf

我想使用PowerShell将PDF文件的内容复制到文本文件中。我能够使用下面的代码解析PDF的内容,但我不知道如何将解析的数据复制到文本文件中。

Add-Type -Path .\itextsharp.dll
$reader = New-Object iTextSharp.text.pdf.pdfreader -ArgumentList "$pwd\test.pdf".

for ($page = 1; $page -le $reader.NumberOfPages; $page++) {
  $lines = [char[]]$reader.GetPageContent($page) -join "" -split "`n"
  foreach ($line in $lines) {
    if ($line -match "^\[") {   
      $line = $line -replace "\\([\S])", $matches[1]
      $line -replace "^\[\(|\)\]TJ$", "" -split "\)\-?\d+\.?\d*\(" -join ""
    }
  }
}

1 个答案:

答案 0 :(得分:0)

最简单的方法是将for循环的输出分配给变量,然后将其写入文件:

$data = for ($page = 1; $page -le $reader.NumberOfPages; $page++) {
          ...
        }

$data | Out-File 'C:\path\to\your.txt' -Encoding UTF8