powershell:从网站列表中提取元数据

时间:2012-11-13 09:35:32

标签: .net html powershell metadata

我在文本文件中有一个网站列表,我希望收集主页的元数据。我怎么能这样做?

例如,我要检索的网站“”元数据是

meta name="keywords" content="**Chamber of Mines, South Africa, Mining**

1 个答案:

答案 0 :(得分:2)

这样的事情:

$web = New-Object Net.WebClient
$a = $web.DownloadString("Http://www.bullion.org.za")
$a | Select-String -Pattern '(meta name="keywords".+")' -allmatches |
   select -expa matches | select -expa value

这回归:

meta name="keywords" content="Chamber of Mines, South Africa, Mining"