我正在使用Python 3.5创建一个简单的脚本,它会询问标题(例如一首歌),它会在youtube.com/results?search_query=my+title上提取并提取html代码。
这就是我所做的,但现在我遇到了一个问题:我希望我的脚本列出视频命题标题并注册相应的链接,所以例如它给了我一个这样的列表
搜索:“eazy e”
- Eazy E - Real muthaf ***** G's
- Eazy E - Da Hood等男孩..
醇>插入视频编号:
这里的问题是我有大量的html代码,我不知道如何列出我想要的内容......
我使用了urlib.request.urlopen('http://youtube.com/results?search_query='+ url_search_content)来提取html代码
请帮忙
答案 0 :(得分:0)
您可以使用python中内置的htmlparser库来提取包含所需视频标题的标记。该库将为您提供多种解析标签的方法,并为您提供更清晰的可读输出。
https://docs.python.org/3/library/html.parser.html
请注意,虽然youtube搜索结果通常是多页内容,但您的html结果仅适用于其中一个页面。