标签: html-parser jericho-html-parser
我想使用Parser确定正文中特定H2(或h3 / h4 / h5 / h6)文本的出现位置编号。按位置编号I表示在此特定h2(或h3 / h4 / h5 / h6)短语之前发生的“单词”数量的计数...此外,如果h2和h4文本中都出现短语(例如)我如何确保获得这两个文本的正确位置编号?
答案 0 :(得分:1)
没有简单的方法来做这种非标准的要求。
你必须找到标签,在其中找到文字,记住他们的位置,解析之前的所有内容并计算“单词”。这不是火箭科学,但可能需要一些时间来编码和测试。