使用urlextract从网站中提取所有网址

时间:2019-01-31 06:32:06

标签: python-3.x

因此,我遇到了称为urlextract的软件包。我想从网站中提取所有url,但这似乎有些问题。

我试图在上搜索错误,但是找不到任何东西。如果有人可以告诉我我在这里做错了,那将是一个很大的帮助

from urlextract import URLExtract as extract
blogs = extract.find_urls("www.google.com")


TypeError                                 Traceback (most recent call last)
<ipython-input-5-b9c0f138f47d> in <module>
----> 1 blogs = extract.find_urls("www.google.com")

TypeError: find_urls() missing 1 required positional argument: 'text'

1 个答案:

答案 0 :(得分:1)

方法find_urls()不是类classmethod的{​​{1}},这意味着在函数URLExtract中至少需要两个参数。 但是,当执行find_urls(self,text,*args),即代码中的URLExtract.find_urls(var)时,仅给出extract.find_urls(var),因此,您将获得self的{​​{1}}例外帐户。因此,使用:

TypeError