如何使用XPath解析HTML字符串

时间:2018-10-05 10:08:48

标签: html go xpath

如何在Go中使用XPath选择图像(或其他HTML标记)?

resp, _ := http.Get(url)
bytes, _ := ioutil.ReadAll(resp.Body)

s := string(bytes))

如何使用XPath解析s

喜欢以下代码:

list := libxxxx.Find(s, "//a@href")

我用http.Get得到HTML代码,但是当我想解析它时,我遇到了问题。

1 个答案:

答案 0 :(得分:4)

您可以使用htmlquery

doc, err := htmlquery.LoadURL("http://example.com/")

或使用字符串:

s := `<html>....</html>`
doc, err := htmlquery.Parse(strings.NewReader(s))

然后找到所有内容:

list := htmlquery.Find(doc, "//a")
list := range htmlquery.Find(doc, "//a[@href]")