回答。用户PuerkitoBio帮助我完成了他的goquery
套餐,我确信我不会成为唯一一个想知道如何做到这一点的人。 (我可以将此问题标记为'在两天内回答)
当使用goquery
查找html标记的类时,我在类包含空格时遇到了问题。这是一个例子:
package main
import (
"fmt"
"github.com/PuerkitoBio/goquery"
"strings"
)
func main() {
html_code := strings.NewReader(`
<html>
<body>
<h1>
<span class="text title">Go </span>
</h1>
<p>
<span class="text">totally </span>
<span class="post">kicks </span>
</p>
<p>
<span class="text">hacks </span>
</p>
</body>
<html>
`)
doc, _ := goquery.NewDocumentFromReader(html_code)
}
如果我想找到班级"text title"
,我想我会这样做:
doc.Find(".text title").Each(func(i int, s *goquery.Selection) {
class, _ := s.Attr("class")
fmt.Println(class, s.Text())
})
但这不起作用。 (答案如下。)
答案 0 :(得分:5)
我对HTML的理解存在问题。 class="text title"
中的空格显示class
有两个值:text
和title
。为了找到具有goquery
的类的多个属性,我需要将它们并排放置(没有空格),并在前面添加.
。像这样:
doc.Find(".text.title").Each(func(i int, s *goquery.Selection) {
class, _ := s.Attr("class")
fmt.Println(class, s.Text())
})
或者,如果我想找到仅值为title
的类,我会这样做:
doc.Find(".title").Each(func(i int, s *goquery.Selection) {
class, _ := s.Attr("class")
fmt.Println(class, s.Text())
})