我不知道标题是否非常准确 我有5种方法可以网页抓取不同的网站。每个函数看起来像这样:
def getWebsiteData1(last_article):
ty = datetime.today()
ty_str = ty.strftime('%d.%m.%Y')
url = 'http://www.website.com/news'
r = requests.get(url)
html = r.text
soup = BeautifulSoup(html, 'html.parser')
articles = soup.findAll("div", {"class": "text"})[:15]
data = list()
for article in articles:
article_data = dict()
if article.find("a").get('href') == last_article:
return data
else:
article_data["link"] = article.find("a").get('href')
article_data["title"] = article.find("a").get_text()
data.append(article_data)
return data
因此每个函数都返回一个字典列表 我有另一个函数调用这个函数:
def CreateArticle(website_number, slug):
website = Website.objects.get(slug=slug)
last_article = website.last_article
data = getWebsiteData1(last_article) # here i want to do something like
data = website_number(last_article) # but ofcourse this doesnt work
if len(data) == 0:
return "No news"
else:
for i in data:
article = Article(service=service)
article.title = i['title']
article.url = i['link']
article.code = i['link']
article.save()
service.last_article = data[0]['link']
service.save(update_fields=['last_article'])
return data[0]['link']
我希望能够调用CreateArticle(website_number)并告诉该函数它应该调用哪个getWebsiteData
函数,所以我只能有一个CreateArticle
函数而不是每个webscrapper函数另一个CreateArticle函数。
我希望我的问题很明确:D
答案 0 :(得分:2)
在python函数中是第一类,可以作为参数传递给其他函数。
def a():
print("x")
def b(some_function):
some_function()
然后
b(a)
将打印" x"在a中被称为a。
因此,您可以确定要使用的功能,然后将其传递以供使用。