我想提取特定标签的htm文本,因此here是我想要提取其htm文本的链接 我使用此标记来提取特定记录的整个htm文本
TAG POS=2 TYPE=div ATTR=class:m-srp-card<SP>SRCard&&TXT:* EXTRACT=HTM
因此,只需更改POS=?
数字,我就可以获得每条记录的htm文本,但在这种情况下,属性class:m-srp-card<SP>SRCard
会因不同的位置而发生变化。例如,当POS = 3时,它标记第4条记录而不是第3条记录。
有没有其他方法我可以更改POS
号码并获得htm记录?
由于
DOMNICK。
答案 0 :(得分:1)
我检查了您提供的链接,问题在于您提到的attribute selector
,您遇到此问题的原因是因为它确切地检查div中的类为m-srp-card<SP>SRCard
但是在某些元素中还有其他类存在,我的解决方案是在类的末尾添加一个通配符(*
),以便它具有灵活性并允许其他类存在。
VERSION BUILD=1001 RECORDER=CR
SET !ERRORIGNORE YES
SET !LOOP 1
TAG POS={{!LOOP}} TYPE=div ATTR=class:m-srp-card<SP>SRCard* EXTRACT=HTM
我还设置了一个循环,可以重新运行迭代div,还包括第二行,它将处理html中不存在特定标记的情况。
如果这可以解决您的问题,请与我们联系!