我有一个包含数据的数组,我注意到我有两次数据。有没有方法可以删除重复数据以简化数组内容?下面是我在python中创建的代码:
import requests
import re
import bs4
r = requests.get("http://as.com/tag/moto_gp/a/")
r.raise_for_status()
html = r.text
matches = re.findall(r"http://motor\.as\.com/motor/\d+/\d+/\d+/motociclismo/\d+_\d+.html", html)
print (matches)
答案 0 :(得分:7)
我希望你的matches
是一个列表。然后你可以使用简单的方法。
In [1]: a = [1,1,2,2,3,3,4,4,5]
In [2]: list(set(a))
Out[2]: [1, 2, 3, 4, 5]
只为您的代码进行一次修改。
matches = list(set(re.findall(r"http://motor\.as\.com/motor/\d+/\d+/\d+/motociclismo/\d+_\d+.html", html)))