我试图在其他列的pandas数据框架中生成一个新列,并且遇到一些我不理解的数学错误。以下是问题的快照和一些简化的诊断......
我可以生成一个看起来很不错的数据框:
import pandas
import math as m
data = {'loc':['1','2','3','4','5'],
'lat':[61.3850,32.7990,34.9513,14.2417,33.7712],
'lng':[-152.2683,-86.8073,-92.3809,-170.7197,-111.3877]}
frame = pandas.DataFrame(data)
frame
Out[15]:
lat lng loc
0 61.3850 -152.2683 1
1 32.7990 -86.8073 2
2 34.9513 -92.3809 3
3 14.2417 -170.7197 4
4 33.7712 -111.3877 5
5 rows × 3 columns
我可以做简单的数学运算(即度数到弧度):
In [32]:
m.pi*frame.lat/180.
Out[32]:
0 1.071370
1 0.572451
2 0.610015
3 0.248565
4 0.589419
Name: lat, dtype: float64
但我无法使用python数学库将度数转换为弧度:
In [33]:
m.radians(frame.lat)
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-33-99a986252f80> in <module>()
----> 1 m.radians(frame.lat)
/Users/user/anaconda/lib/python2.7/site-packages/pandas/core/series.pyc in wrapper(self)
72 return converter(self.iloc[0])
73 raise TypeError(
---> 74 "cannot convert the series to {0}".format(str(converter)))
75 return wrapper
76
TypeError: cannot convert the series to <type 'float'>
甚至无法将值转换为浮点值以试图强制它起作用:
In [34]:
float(frame.lat)
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-34-3311aee92f31> in <module>()
----> 1 float(frame.lat)
/Users/user/anaconda/lib/python2.7/site-packages/pandas/core/series.pyc in wrapper(self)
72 return converter(self.iloc[0])
73 raise TypeError(
---> 74 "cannot convert the series to {0}".format(str(converter)))
75 return wrapper
76
TypeError: cannot convert the series to <type 'float'>
我确定必须有一个简单的解释,并感谢您帮助我找到它。谢谢!
答案 0 :(得分:8)
数学函数(如math.radians)需要一个数值,例如float,而不是像pandas.Series
这样的序列。
相反,您可以使用numpy.radians,因为numpy.radians
可以接受数组作为输入:
In [95]: np.radians(frame['lat'])
Out[95]:
0 1.071370
1 0.572451
2 0.610015
3 0.248565
4 0.589419
Name: lat, dtype: float64
只有长度为1的系列可以转换为float
。所以虽然
这很有效,
In [103]: math.radians(pd.Series([1]))
Out[103]: 0.017453292519943295
一般情况下它不会:
In [104]: math.radians(pd.Series([1,2]))
TypeError: cannot convert the series to <type 'float'>
math.radians
在其参数上调用float
。请注意,在float
上调用pd.Series([1,2])
时会出现同样的错误:
In [105]: float(pd.Series([1,2]))
TypeError: cannot convert the series to <type 'float'>
答案 1 :(得分:1)
我有一个类似的问题但是使用了自定义功能。解决方案是使用apply
函数:
def monthdiff(x):
z = (int(x/100) * 12) + (x - int(x/100) * 100)
return z
series['age'].apply(monthdiff)
现在,我有一个新列,我的简单(但很漂亮)计算应用于数据框中的每一行!
答案 2 :(得分:0)
尝试:
pd.to_numeric()
当我得到同样的错误时,这对我有用。