我正在尝试标记HTML元数据,包括一些opg。我有令牌生成器tokenizer := html.NewTokenizer(htmlStream)
遍历标签。
但是对于opg og:img
标记,可能有多个图像,并且紧接在先前og:img
标记之后的属性就是该图像上的属性。例如,从opg
<meta property="og:image:width" content="300" />
<meta property="og:image:height" content="300" />
<meta property="og:image" content="http://example.com/rock2.jpg" />
<meta property="og:image" content="http://example.com/rock3.jpg" />
<meta property="og:image:height" content="1000" />
我需要首先知道下一个属性,以决定是开始一个新对象还是添加到现有图像对象。似乎没有类似于peek
的函数,它出现在我看来像是数组中的两个迭代器,但是当我启动并使用新的标记生成器{{1}时,Go正在报告错误和空标记},有没有一种方法可以做到这一点。 TBH我在没有首先测试令牌化程序的情况下在这种方法上走得太远。但我也愿意听取其他有关此方法的信息。