在jython中,有没有办法创建一个以url(html)作为参数的函数,并返回url的标题(<title>
和</title>
之间的任何内容) ?
答案 0 :(得分:1)
当然是!
首先要分析的下载页面。您可以使用urllib2
模块执行此操作。阅读其文档,在底部,您将找到有关如何阅读页面内容的示例。
如果您有网页内容,则必须在其中找到标题。你可以通过很多方式做到这一点。有解析HTML的模块,但是对于这么简单的任务,你可以使用正则表达式(模块re
)甚至字符串函数(find()
方法)。
请注意,HTML标记区分大小写,因此,如果您要使用find()
方法查找标题的开头和结尾,则可能还需要lower()
方法和原始页面的副本。< / p>