获取存储在Powershell数组中的HTML代码以检索某些字符串

时间:2014-10-09 12:31:49

标签: html arrays regex powershell

<div class="primary-title-and-description">
    <h1>
        Title Here
    </h1>

    <p>
        Paragraph Here
    </p>
</div>

您好

我正在尝试仅从<h1></h1>获取<div class="primary-title-and-description">内的值。我该怎么做呢?

上面只是一段代码,我使用webClient.DownloadString($ URL)来获取上述内容。 powershell命令只能输出如下输出? 标题在这里

1 个答案:

答案 0 :(得分:2)

使用功能就好 $&GT; Get-Title&lt;把这里的网页链接&gt;

这将获得网页的源代码并使用正则表达式切割所有内容&lt; H1&GT;和&lt; / H1&GT;

Function Get-Title { 
    param([string] $url)
		
    $webClient = New-Object System.Net.WebClient 
    $data = $webClient.downloadstring($url) 
    $title = [regex] '(?<=<h1>)([\S\s]*?)(?=</h1>)' 
    write-Host $title.Match($data).value.trim() 
}

祝你好运


如果得到帮助,请记住有用的答案