我正在开发一个Android恶意软件分析项目,因为我必须创建一个良好的Android数据集(需要大约20000个.apk文件)。
所以我想从python
中的website下载所有.apk文件import requests
import wget
import os
from bs4 import BeautifulSoup, SoupStrainer
url = 'https://www.9apps.com/'
file_types = ['.apk']
for file_type in file_types:
response = requests.get(url)
for link in BeautifulSoup(response.content, 'html.parser', parse_only=SoupStrainer('a')):
if link.has_attr('href'):
if file_type in link['href']:
full_path = url + link['href']
wget.download(full_path)
但它不起作用。