我有一个数据行,其中包含旅行开始和结束的经/纬度坐标。我想添加一个“距离”列来记录行程长度
我知道我可以进行分配以添加这样的列:
test = tt.assign(distance = tt.to_lat +
tt.to_long + tt.from_lat + tt.from_long)
这将创建一个带有“距离”列的新df(“测试”),该列是行程的经纬度数字之和。
我还测试了距离函数,它可以在单行中使用:
distance.distance((tt.iloc[1]['from_lat'],tt.iloc[1]['from_long']),
(tt.iloc[1]['to_lat'],tt.iloc[1]['to_long'])).miles
因此,结合这两个测试,我要做的是这样的:
test2 = tt.assign(distance = distance.distance(
(tt.from_lat,tt.from_long),
(tt.to_lat,tt.to_long)).miles)
这不起作用,生成一个
ValueError :系列的真值不明确。使用a.empty,a.bool(),a.item(),a.any()或a.all()。
我的加法测试表明,assign函数将从一行中的四个值中提取并相加。我不明白为什么一个模棱两可而另一个很好。
提前感谢您的任何建议!