我有一个链接列表,我想查看它们是否列在我的拒绝文件中。
我的拒绝文件包含两个网址(例如http://getpaydayloan.org/blog/blog-how-to-apply-for-online-payday-loans-san
)以及整个网域,列为domain:getpaydayloan.org
。
新的网址文件仅包含网址,例如http://getpaydayloan.org/blog/blog-how-to-apply-for-online-payday-loans-san
我想查看新网址是否已在disavow文件中。我目前正在使用diff = set(url_set)-set(disavow_urls)
生成差异,但我还需要使用domain:url.com
格式检查它们是否在disavow文件中。
我该怎么做?
如果有帮助,这里是整个脚本:https://github.com/growth-austen/disavow_automator
答案 0 :(得分:1)
这是一个检查网址是否包含任何被拒绝的域的函数。
grails.plugin.springsecurity.userLookup.usernamePropertyName= 'email'
答案 1 :(得分:1)
David的一些替代定义是为了娱乐:
return any(domain in url for domain in disavowDomainList)
return any(map(url.__contains__, disavowDomainList))
(在Python 2中用map
替换itertools.imap
以提高内存效率)