比较字符串与修改后的字符串&部分字符串

时间:2016-05-05 19:52:03

标签: python

我有一个链接列表,我想查看它们是否列在我的拒绝文件中。

我的拒绝文件包含两个网址(例如http://getpaydayloan.org/blog/blog-how-to-apply-for-online-payday-loans-san)以及整个网域,列为domain:getpaydayloan.org

新的网址文件仅包含网址,例如http://getpaydayloan.org/blog/blog-how-to-apply-for-online-payday-loans-san

我想查看新网址是否已在disavow文件中。我目前正在使用diff = set(url_set)-set(disavow_urls)生成差异,但我还需要使用domain:url.com格式检查它们是否在disavow文件中。

我该怎么做?

如果有帮助,这里是整个脚本:https://github.com/growth-austen/disavow_automator

2 个答案:

答案 0 :(得分:1)

这是一个检查网址是否包含任何被拒绝的域的函数。

grails.plugin.springsecurity.userLookup.usernamePropertyName= 'email'

答案 1 :(得分:1)

David的一些替代定义是为了娱乐:

return any(domain in url for domain in disavowDomainList) return any(map(url.__contains__, disavowDomainList))

(在Python 2中用map替换itertools.imap以提高内存效率)