如何在特定HTML标记(例如“ <title> ... <\ title>”)之间获取内容

时间:2018-09-17 01:22:52

标签: python html regex python-3.x

我正在寻找一种从html抓取特定标签的快速方法。特别是标记和内容 [“ .. <\ title>”] </code>。</p> <p>尝试使用导入<code> lxml </code>,例如 ... </p> <pre> <code> tree = html.fromstring(page.content)#仅获取属性错误 </code> </pre> <p> ... </p> <p>当我搜索Google或任何地方的任何清晰完整的示例时,我将不胜感激,我已经死了。 我什至尝试了一些正则表达式,但是由于我对python和regex的经验有限,所以无法提供所需的输出。</p> </div> <div class="answer-list"> <h4>0 个答案:</h4> <div class="hr-line-dashed"></div> <div>没有答案</div> </div> </div> <div class="right"> <div style="height:400px"> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6263610230477973" data-ad-slot="2820756182" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div style="height:20px"></div> <div class="releated-question-wrapper"> <div class="header"> 相关问题 </div> <div class="hr-line-dashed"></div> <ul> <li> <a href="/q/38691">如何获取HTML标签的内容?</a> </li> <li> <a href="/q/15453800">将UIWebView页面标题添加为NSString</a> </li> <li> <a href="/q/21076201"><meta name =“title”/>标记与<title> </title>标记之间的区别</a> </li> <li> <a href="/q/26327964">Java读取标题等特定项目</a> </li> <li> <a href="/q/28601924">如何使用php获取<li>标签之间的内容?</li></a> </li> <li> <a href="/q/36228622">使用<title>标记内容填充<input />元素</a> </li> <li> <a href="/q/44688632">c#HtmlAgilityPack,如何获取特定标签的所有出现的InnerText?</a> </li> <li> <a href="/q/50084116">php:将“alt tag”内容回显到“title tag”</a> </li> <li> <a href="/q/52359706">如何在特定HTML标记(例如“ <title> ... <\ title>”)之间获取内容</a> </li> <li> <a href="/q/53341725">Beautifullsoup:如何获取<a> tag thats within a </a> <h1> <a>?</a> </li> </ul> </div> <div class="releated-question-wrapper"> <div class="header"> 最新问题 </div> <div class="hr-line-dashed"></div> <ul> <li> <a href="/q/68614764">我写了这段代码,但我无法理解我的错误</a> </li> <li> <a href="/q/68614678">我无法从一个代码实例的列表中删除 None 值,但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场?</a> </li> <li> <a href="/q/68614175">是否有可能使 loadstring 不可能等于打印?卢阿</a> </li> <li> <a href="/q/68614313">java中的random.expovariate()</a> </li> <li> <a href="/q/68614125">Appscript 通过会议在 Google 日历中发送电子邮件和创建活动</a> </li> <li> <a href="/q/68615109">为什么我的 Onclick 箭头功能在 React 中不起作用?</a> </li> <li> <a href="/q/68615123">在此代码中是否有使用“this”的替代方法?</a> </li> <li> <a href="/q/68614097">在 SQL Server 和 PostgreSQL 上查询,我如何从第一个表获得第二个表的可视化</a> </li> <li> <a href="/q/68614427">每千个数字得到</a> </li> <li> <a href="/q/68615239">更新了城市边界 KML 文件的来源?</a> </li> </ul> </div> <div class=""> </div> </div> </div> <div> <script> var host = window.location.host; if (host =="www.thinbug.com"){ (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })(); } </script> </body> </html>