将函数应用于DataFrame列将返回NoneType

时间:2016-10-04 17:01:21

标签: python pandas networking

我有一个带有源IP地址的DataFrame,我想检查它们是否属于记录的CIDR范围。

netflow_df2["sip"].head(10)

timestamp
2016-10-04 16:24:58    40.101.X.X
2016-10-04 16:24:58    40.101.X.X
2016-10-04 16:24:58     40.101.X.X
2016-10-04 16:24:58     67.X.X.X
2016-10-04 16:24:58        10.1.1.X
2016-10-04 16:24:58      10.1.Y.Y



import ipaddress
import numpy
from collections import defaultdict
from pandas.util.testing import test_parallel

我把所有记载的CIDR放在一个字典中:

# dict to key (vlan, designation)
nets = defaultdict(str)
nets["10.1.0.0/24"] = "13, web"
net["10.2.0.0/24"] = "14, department X"
net["10.3.55.0/24"] = "601, wifi"
...
net["10.1.243.0/24"] = "1337, IT"

我定义了我的功能:

def netmap(ip, network_lookup_dict):
    for key, value in network_lookup_dict.iteritems() :
        if ipaddress.ip_address(unicode(ip)) in ipaddress.ip_network(unicode(key)):
            return value
            # print "VLAN: " + infos[0].strip() + ", Network designation: " + infos[1].strip()
        else:
            return numpy.NAN

现在我映射它:

@test_parallel(num_threads=4)
def apply_netmap(netflow_df2, location="ABC"):
    % time netflow_df2["sip_infos"] = netflow_df2["sip"].map(lambda ip: netmap(ip, nets))
    return netflow_df2


CPU times: user 3min 14s, sys: 21.2 s, total: 3min 36s
Wall time: 3min 5s


netflow_df3 = apply_netmap(netflow_df2)

我的错误是:

netflow_df3.head(10)
  

AttributeError:'NoneType'对象没有属性'head'

我认为此功能会将netmap()的返回值映射到DataFrame列。这就是我也返回NAN的原因。情况似乎并非如此。它也非常慢。

1 个答案:

答案 0 :(得分:0)

问题是我使用defaultdict函数中的netmap错了。这产生了更正结果:

def netmap(ip, network_lookup_dict):
    for key, value in network_lookup_dict.iteritems(): 
        try:
            if ipaddress.ip_address(unicode(ip)) in ipaddress.ip_network(unicode(key)):
                return network_lookup_dict.get(key)
        except KeyError:
            print "duh"
            return numpy.NaN

return声明被破坏了。令我困惑的是,为什么这会破坏DataFrame对象,但我想一切都有错误。