我有一个pandas dataFrame,它由许多列组成,但只有一行。当我遍历每一列以获得每行的包含时,我得到2个单独的数字;即一个用于索引和数字本身。 假设df是我的dataFrame,我执行以下操作
for k,v in df.iteritems():
if df[k]>df.mean(axis=1):
print(" do something")
我收到以下错误:ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
当我打印df [k]时,我有两个值0 num
如何删除第一个值?
修改
这是我的数据框的结构
column1 column2 column3
0 2 3 -4
我现在有
for k,v in df.iteritems():
if df[k][0]>3* abs(df.mean(axis=1)):
print(" do something")
现在错误是:TypeError: len() of unsized object
答案 0 :(得分:7)
你得到一个Series
返回,只获取标量值,然后执行:
df[k].values[0]
示例:
In [190]:
df = pd.DataFrame(columns=list('abc'), data = np.random.randn(1,3))
df
Out[190]:
a b c
0 0.994306 -0.340043 -0.551422
In [191]:
for col in df:
print(df[col].values[0])
0.994306161647
-0.340042912281
-0.551421752498
如果您不喜欢打字,这也会奏效:
df[k][0]