在给定html节点的网页上获取可见文本

时间:2016-04-13 03:57:05

标签: go

我有一些网页,我只想获得用户可见的文字。目前,我通过执行以下操作来检查文本:

n *html.Node

if n.Type == html.TextNode{
    print
}

问题是我的文本中引入了CSS代码,有没有办法只获取文本?即。

<h1> I want to get this text and all others like it </h1>

1 个答案:

答案 0 :(得分:0)

使用GOQuery - 这非常简单。

doc, err := goquery.NewDocument("http://yoursite.com")
doc2.Find("h1").Each(func(i int, s *goquery.Selection) {
your_text,_ := s.Text()
}
祝你好运!