我有一些网页,我只想获得用户可见的文字。目前,我通过执行以下操作来检查文本:
n *html.Node
if n.Type == html.TextNode{
print
}
问题是我的文本中引入了CSS代码,有没有办法只获取文本?即。
<h1> I want to get this text and all others like it </h1>
答案 0 :(得分:0)
使用GOQuery - 这非常简单。
doc, err := goquery.NewDocument("http://yoursite.com")
doc2.Find("h1").Each(func(i int, s *goquery.Selection) {
your_text,_ := s.Text()
}
祝你好运!