使用goquery查找其值包含空格的类

时间:2015-01-14 00:15:30

标签: go html-parsing goquery

回答。用户PuerkitoBio帮助我完成了他的goquery套餐,我确信我不会成为唯一一个想知道如何做到这一点的人。 (我可以将此问题标记为'在两天内回答)

当使用goquery查找html标记的类时,我在类包含空格时遇到了问题。这是一个例子:

package main

import (
    "fmt"
    "github.com/PuerkitoBio/goquery"
    "strings"
)

func main() {
    html_code := strings.NewReader(`
<html>
    <body>
        <h1>
            <span class="text title">Go </span>
        </h1>
        <p>
            <span class="text">totally </span>
            <span class="post">kicks </span>
        </p>
        <p>
            <span class="text">hacks </span>
        </p>
    </body>
<html>
    `)
    doc, _ := goquery.NewDocumentFromReader(html_code)
}

如果我想找到班级"text title",我想我会这样做:

doc.Find(".text title").Each(func(i int, s *goquery.Selection) {
    class, _ := s.Attr("class")
    fmt.Println(class, s.Text())
})

但这不起作用。 (答案如下。)

1 个答案:

答案 0 :(得分:5)

我对HTML的理解存在问题。 class="text title"中的空格显示class有两个值:texttitle。为了找到具有goquery的类的多个属性,我需要将它们并排放置(没有空格),并在前面添加.。像这样:

doc.Find(".text.title").Each(func(i int, s *goquery.Selection) {
    class, _ := s.Attr("class")
    fmt.Println(class, s.Text())
})

或者,如果我想找到值为title的类,我会这样做:

doc.Find(".title").Each(func(i int, s *goquery.Selection) {
    class, _ := s.Attr("class")
    fmt.Println(class, s.Text())
})