熊猫系列/数据帧的对数

时间:2016-10-14 03:16:32

标签: python pandas numpy matplotlib

简而言之:如何获得pandas数据帧列的对数? 我认为numpy.log()应该对它起作用,但它不是。我怀疑它是因为我在数据框中有一些NaN

我的整个代码如下。它可能看起来有点混乱,基本上我的最终目标(有点夸张)是将几个选定列中不同选定列的不同行绘制成几个子图(因此嵌入的三个循环在不同组之间迭代...如果你建议一个更优雅的解决方案,我会很感激,但这不是主要的事情,迫使我)。我需要绘制一个数据帧+ 1的某些值的对数与另一个数据帧的某些值的对数。这是问题,在使用np.log的绘图线上我得到了这个错误:AttributeError: 'float' object has no attribute 'log'(如果我使用数学而不是np,我得到这个:TypeError: cannot convert the series to <type 'float'>) 我该怎么办呢?

谢谢。 这是代码:

import numpy as np
import math
import pandas as pd
import matplotlib.pyplot as plt

hf = pd.DataFrame({'Z':np.arange(0,100,1),'A':(10*np.random.rand(100)), 'B':(10*np.random.rand(100)),'C':(10*np.random.rand(100)),'D':(10*np.random.rand(100)),'E':(10*np.random.rand(100)),'F':(10*np.random.rand(100))})
df = pd.DataFrame({'Z':np.arange(0,100,1),'A':(10*np.random.rand(100)), 'B':(10*np.random.rand(100)),'C':(10*np.random.rand(100)),'D':(10*np.random.rand(100)),'E':(10*np.random.rand(100)),'F':(10*np.random.rand(100))})
hf.loc[0:5,'A']=np.nan
df.loc[0:5,'A']=np.nan
hf.loc[53:58,'B']=np.nan
df.loc[53:58,'B']=np.nan
hf.loc[90:,'C']=np.nan
df.loc[90:,'C']=np.nan
I = ['A','B']
II = ['C','D']
III = ['E','F']
IV = ['F','A']
runs = [I,II,III,IV]
inds = [10,20,30,40]

fig = plt.figure(figsize=(6,4))
for r in runs:
    data = pd.DataFrame(index=df.index,columns=r)
    HF = pd.DataFrame(index=hf.index,columns=r)
    #pdb.set_trace()
    for i in r:
        data.loc[:,i] = df.loc[:,i]
        HF.loc[:,i] = hf.loc[:,i]
        for c,z in enumerate(inds):
            ax=fig.add_subplot()
            ax = plt.plot(math.log1p(HF.loc[z]),Tdata.loc[z],linestyle=":",marker="o",markersize=5,label=inds[c].__str__())
# or the other version
#plt.plot(np.log(1 + HF.loc[z]),Tdata.loc[z],linestyle=":",marker="o",markersize=5,label=inds[c].__str__())

正如@Jason指出的那样,this answer成功了!谢谢!

1 个答案:

答案 0 :(得分:4)

问题不在于您有NaN个值,而是没有具有NaN值,您有字符串 { {1}} "NaN"不知道如何处理的{1}}。用以下代码替换代码的开头:

ufunc

一切都应该与np.log

很好地配合