使用C ++读取HTML文件以在<p>和</p> <h3>标记之间提取内容

时间:2018-03-14 04:09:45

标签: c++ qt boost

我有以下html文件:

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 3.2 Final//EN" "http://www.w3.org/MarkUp/Wilbur/HTML32.dtd">
<html xmlns="http://www.w3.org/MarkUp/Wilbur/HTML32.dtd">
  <head>
    <meta http-equiv="Content-Type" content="text/html;charset=utf-8">
  </head>
  <body style="margin-left: 5%;">
    <a name="pagetop"></a>
    <a name="firstpage"></a> 
    <div>
    <h3>Content to read I</h3>
         <p>
Content to read II<br><br>
</p>
          <img src="abc.svg" width="200" height="166" alt="">
<br><br>    
<h4>Code:ABC</h4>
      <!-- End Buttons -->
    </div>
  </body>
</html>

我想阅读2个标签之间的内容&lt; p> (没有&lt; br&gt;)和&lt; h3&gt; 是否有一些可用的标准可以说实现相同的提升?

0 个答案:

没有答案