有没有一种方法可以在Go中复制HTML令牌生成器?

时间:2020-04-11 06:34:35

标签: html go tokenize meta-tags

我正在尝试标记HTML元数据,包括一些opg。我有令牌生成器tokenizer := html.NewTokenizer(htmlStream)遍历标签。

但是对于opg og:img标记,可能有多个图像,并且紧接在先前og:img标记之后的属性就是该图像上的属性。例如,从opg

<meta property="og:image:width" content="300" />
<meta property="og:image:height" content="300" />
<meta property="og:image" content="http://example.com/rock2.jpg" />
<meta property="og:image" content="http://example.com/rock3.jpg" />
<meta property="og:image:height" content="1000" /> 

我需要首先知道下一个属性,以决定是开始一个新对象还是添加到现有图像对象。似乎没有类似于peek的函数,它出现在我看来像是数组中的两个迭代器,但是当我启动并使用新的标记生成器{{1}时,Go正在报告错误和空标记},有没有一种方法可以做到这一点。 TBH我在没有首先测试令牌化程序的情况下在这种方法上走得太远。但我也愿意听取其他有关此方法的信息。

0 个答案:

没有答案