Python:数据集中的行百分比

时间:2018-09-30 09:32:30

标签: python python-3.x numpy

我是python和numpy的新手。我想找到在数据集中出现阈值的时间百分比。我创建了一个函数来执行此任务。我已经使用numpy提取了数据,

datanew2 = np.array(data[:,4]) # this has 600 elements

def func1():
    x = float(input("Max threshold value: "))
    for i in range(600):
        if datanew2[i] >= x:
            A = datanew2[i]
    print(A.shape)

func1()

当我将此函数称为func1时,我得到以下信息;

()

我想知道数据集(datanew2)中的阈值小于datanew2中元素的阈值,所以我可以找到出现百分比。

谢谢你的建议。

1 个答案:

答案 0 :(得分:1)

使用数组比较,然后sum将该数组用作:

a = np.arange(10).reshape(2,5)
print(a)
array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])

threshold=5
(a>=threshold).sum()

5