我正在尝试在python中编写一个for循环,将一个数组px
中的每个第i个元素与另一个数组py
中的第i个元素进行比较。如果px
中的元素大于或等于py
的元素,则我要将该值视为True
或1.
这是一些代码。
import pandas as pd
import random
px = np.random.normal(loc=0, scale=1, size=1000)
py = np.random.normal(loc=0, scale=1, size=1000)
for x, y in zip(px, py):
print("{}% {}".format(x, y))
if px[i] >= py[i]:
px['status'] = True
if px[i] < py[i]:
px['status'] = False
最终的数据框应如下所示:
px py status
-2.24239571e-01 -1.83834445e+00 False
1.20102447e+00 5.01755172e-03 False
8.82060986e-02 -2.55639665e-02 True
我知道我的for循环有一些问题。
答案 0 :(得分:3)
如果你想要速度,你不应该遍历数组。相反,可以使用df['status'] = px >= py
在矢量化操作中完成比较。从您的问题中不清楚数据是否已经存在于Dataframe中,所以从头开始:
import numpy as np
import pandas as pd
px = np.random.normal(loc=0, scale=1, size=1000)
py = np.random.normal(loc=0, scale=1, size=1000)
df = pd.DataFrame({'px': px, 'py': py, 'status': px >= py})
print(df.head())
答案 1 :(得分:1)
例如,未定义用作索引的i
。
相反,只需使用已经从for循环获得的x
和y
。