Python:从提取的HTML列出youtube视频标题和网址

时间:2016-10-06 14:26:21

标签: python html video youtube

我正在使用Python 3.5创建一个简单的脚本,它会询问标题(例如一首歌),它会在youtube.com/results?search_query=my+title上提取并提取html代码。

这就是我所做的,但现在我遇到了一个问题:我希望我的脚本列出视频命题标题并注册相应的链接,所以例如它给了我一个这样的列表

  

搜索:“eazy e”

     
      
  1. Eazy E - Real muthaf ***** G's
  2.   
  3. Eazy E - Da Hood等男孩..
  4.         

    插入视频编号:

这里的问题是我有大量的html代码,我不知道如何列出我想要的内容......

我使用了urlib.request.urlopen('http://youtube.com/results?search_query='+ url_search_content)来提取html代码

请帮忙

1 个答案:

答案 0 :(得分:0)

您可以使用python中内置的htmlparser库来提取包含所需视频标题的标记。该库将为您提供多种解析标签的方法,并为您提供更清晰的可读输出。

https://docs.python.org/3/library/html.parser.html

请注意,虽然youtube搜索结果通常是多页内容,但您的html结果仅适用于其中一个页面。