<div class="primary-title-and-description">
<h1>
Title Here
</h1>
<p>
Paragraph Here
</p>
</div>
您好
我正在尝试仅从<h1></h1>
获取<div class="primary-title-and-description">
内的值。我该怎么做呢?
上面只是一段代码,我使用webClient.DownloadString($ URL)来获取上述内容。 powershell命令只能输出如下输出? 标题在这里
答案 0 :(得分:2)
使用功能就好 $&GT; Get-Title&lt;把这里的网页链接&gt;
这将获得网页的源代码并使用正则表达式切割所有内容&lt; H1&GT;和&lt; / H1&GT;
Function Get-Title {
param([string] $url)
$webClient = New-Object System.Net.WebClient
$data = $webClient.downloadstring($url)
$title = [regex] '(?<=<h1>)([\S\s]*?)(?=</h1>)'
write-Host $title.Match($data).value.trim()
}
祝你好运
如果得到帮助,请记住有用的答案