我有一个显示用户所选网站的网络浏览器,然后用户可以在网页浏览器上选择部分文字,并通过mshtml中的IHTMLDocument2
获取所选部分的html文本。我需要提取所选文本的模式,例如所选文本的html文本是
href="/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&p=1&u=%2Fnetahtml%2FPTO%2Fsearch- bool.html&r=1&f=G&l=50&co1=AND&d=PTXT&s1=auv&OS=auv& amp;RS=auv">9041</A>
我的模式是:
\s*href=".+?">.+?</a>
我的问题是,在某些html文本中有标题,类,href等,当我通过IHTMLDocument2
获取html文本时,例如title="..." class="..."
的顺序,但当我读取页面的内容时网络浏览器订单为class="..." title="..."
。如何使用正则表达式构建顺序不重要的模式并找到模式?