我正在尝试学习Python,我有一个问题。
我想从网页源文件中获取所有html链接并将它们附加到列表中。例如,我想在字符串中搜索../lyrics.*html的每个实例,并将这些实例插入列表中。结果将是一个html链接列表,例如:
["../lyrics/steviewonder/lovesinneedoflovetoday.html", "../lyrics/steviewonder/haveatalkwithgod.html", "../lyrics/steviewonder/villageghettoland.html"]
非常感谢帮助!谢谢!
答案 0 :(得分:1)
您可以使用正则表达式搜索此类字符串。
import re
re.match(r"(.*)/lyrics/(.+?)html", line)