我正在尝试使用golang从html中提取文本,并使用goquery库来执行此操作。 代码如下:
document, err := goquery.NewDocumentFromReader(r)
if err != nil {
log.Fatalln(err)
}
document.Find("script").Remove()
document.Find("style").Remove()
text := document.Find("body").Text()
你可以发现结果仍然包含html标签,我怎样才能删除html标签而只保留文字?