Powershell html Fetch / Scrape类

时间:2013-06-15 20:41:47

标签: powershell scrape powershell-v3.0

我正在尝试从this site获取。我正在尝试获取列表中的第一个节目并将其输出到文本。

到目前为止,我试过这个,但无法取得成功。任何反馈都会有所帮助。

$hsg = Invoke-WebRequest -Uri http://www.in.com/tv/channel/set-max-51.html
$hsg | gm -MemberType Property
##$hsg.Links

1 个答案:

答案 0 :(得分:1)

适用于PowerShell v2。 Invoke-WebRequest是v3,我在这台机器上没有。

$hsg = New-Object -ComObject InternetExplorer.Application
$hsg.Navigate("http://www.in.com/tv/channel/set-max-51.html")

$Links = @($hsg.document.getElementsByTagName("a"))
$Links | fl href

这会获得所有链接,但是一旦你知道如何获得链接,那么返回第一个是微不足道的。

现在该页面上有687个链接,这很有趣,因为它很慢。