如何使用goquery检索子元素的完整HTML?

时间:2019-02-23 12:34:24

标签: go goquery

为什么以下测试失败?

func TestGetFirstElementHtml(t *testing.T) {
    test := `<speak><p>My paragraph</p></speak>`
    doc, _ := goquery.NewDocumentFromReader(strings.NewReader(test))
    var childrenHtml []string
    doc.Find("speak").Children().Each(func(i int, s *goquery.Selection) {
        html, _ := s.Html()
        childrenHtml = append(childrenHtml, html)
    })
    if childrenHtml[0] != "<p>My paragraph</p>" {
        t.Fatalf("First element html is not valid: '%s'", childrenHtml[0])
    }
}

这是测试结果:

=== FAIL: . TestGetFirstElementHtml (0.00s)
    main_test.go:45: First element html is not valid: 'My paragraph'

换句话说,鉴于我无法预测该孩子是哪种html元素,我该如何检索其第一个孩子的完整HTML?

1 个答案:

答案 0 :(得分:0)

所需的实际上是外部HTML,您可以通过调用goquery.OuterHTML函数来获取它。根据文档:

func OuterHtml(s *Selection) (string, error)
     

OuterHtml返回第一个项目的外部HTML呈现。   选择-即包含第一个元素标签的HTML和   属性。

     

与InnerHtml不同,这是函数而不是方法   选择,因为这不是jQuery方法(在javascript-land中,   这是DOM提供的属性。)

所以只需将行更改为:

html, _ := goquery.OuterHTML(s)