使用PowerShell读取下载文件的文件名

时间:2016-07-15 11:47:04

标签: powershell

我有一个包含多个文件URL的文件,如下所示:

http://ligman.me/1HCDxl9
http://ligman.me/1HCCCRP
http://ligman.me/1HCCCRP
http://ligman.me/1H4Q0e5
http://ligman.me/1H4Q0e5
http://ligman.me/1JI6V77
http://ligman.me/1JI6V77
http://ligman.me/1CSMobd
http://ligman.me/1CSMobd

我想编写一个PowerShell脚本,它将逐行读取此文件,然后下载每行(URL)后面的文件。到目前为止,我已设法使用以下脚本下载文件:

$reader = [System.IO.File]::ReadLines("C:\Temp\Ebooks\ebooks.txt") | Where-Object { $_ -ne '' }
$targetDir = "C:\Temp\Ebooks\"
$wc = New-Object System.Net.WebClient

foreach($file in $reader) {    
    $sourceFileName = $file.SubString($file.LastIndexOf('/')+1) + ".pdf" 
    $targetFileName = $targetDir + $sourceFileName
    $wc.DownloadFile($file, $targetFileName)
    Write-Host "Downloaded $file successfully to directory $targetDir"
}

我的问题是文件名。现在,我只能将它们保存为PDF,但有时,文件不是PDF文件,而是DOCX或XLSX。而且,如果它们没有被命名为1225DID或13DChwr,那将会很好。基本上,我仍然需要读取实际文件名,然后用该名称保存下载的文件。

我该怎么做?

编辑:这是为了获取实际的文件名,但是当我尝试打开文件时,我收到的错误是他们不是PDF或已损坏(假设我尝试用福昕阅读器打开PDF文件)

$reader = [System.IO.File]::ReadLines("C:\Temp\Ebooks\ebooks.txt") | Where-Object { $_ -ne '' }
$targetDir = "C:\Temp\Ebooks\"
$wc = New-Object System.Net.WebClient

$reader | %{    
    $uri = $_
    $request = Invoke-WebRequest -Uri $uri -MaximumRedirection 0 -ErrorAction Ignore   

    $sourceFileName = $request.Headers.Location.SubString($request.Headers.Location.LastIndexOf('/') + 1) 
    $targetFileName = $targetDir + $sourceFileName
    $wc.DownloadFile($file, $targetFileName)
    Write-Host "Downloaded $file successfully to directory $targetDir"
}

1 个答案:

答案 0 :(得分:3)

使用fiddler,似乎幕后有一个重定向。

如果您执行以下脚本,您将获得真实的"您提供的网址背后的网址。

<a class="someClass" href=#!"></a>

此脚本生成以下列表,其中包含文档名称及其扩展名。

$links = @(
    "http://ligman.me/1HCDxl9",
    "http://ligman.me/1HCCCRP",
    "http://ligman.me/1H4Q0e5",
    "http://ligman.me/1JI6V77",
    "http://ligman.me/1CSMobd"
)

$links | %{
    $uri = $_

    $request = Invoke-WebRequest -Uri $uri -MaximumRedirection 0 -ErrorAction Ignore
    Write-Host $request.Headers.Location
}

以下是下载适用于我的文件的版本:

http://download.microsoft.com/download/4/2/f/42f9b256-977e-4792-a9eb-d490516d4468/AF103733558_en-us_access2013quickstartguide.pdf
http://download.microsoft.com/download/6/7/5/675609de-a32b-44d4-ace6-86305afb808f/AF103733448_en-us_word2013quickstartguide.pdf
http://download.microsoft.com/download/2/8/7/28747b20-70b0-4003-b82a-5ab0d222bbd6/AF103733495_en-us_publisher2013quickstartguide.pdf
http://download.microsoft.com/download/e/6/f/e6fc74dc-9f0d-4e6c-bbcc-6855e4d7a78c/AF103733479_en-us_project2013quickstartguide.pdf
http://download.microsoft.com/download/c/e/b/ceb742d6-bc1f-4447-ad06-b0842338dd8c/AF103733547_en-us_onenote2013quickstartguide.pdf