给定另一个列表中的值,如何编写列表生成器? (或如何计算数据框字段中的值)

时间:2019-07-31 17:33:13

标签: python pandas list dataframe set

我的目标是用一个数据帧的字段中的值制作一个直方图。说:

df = pd.read_csv('file.csv')

然后从df ['field']开始,我可以通过以下方式获得其唯一的可能值:

V_field = {v for v in df['field']}  #unique because is a set

我可以算出每种有价值的事情的数量:

V1 = [j for j in df['field'] if j ==v1]
...
Vn = [j for i in df[´field] if j == vn]

其中vi是V_field中的唯一值。 然后我可以算出在len(Vi)的df ['field']中出现vi的次数

这里的问题是我非常手动地执行此操作,并且可能会发生len(V_field)非常大(我正在处理大数据)的情况。有没有其他方法可以实现这个目标?我当时想在V_field中做一个for循环。像这样:

List = []
for v in V_field:
    v = [i for i in df['field] if i == v]
    List.append(v)

但是我相信它可能会引发错误。

我需要为我正在做的工作设定相对频率。

谢谢您的回答。我对python很陌生。

0 个答案:

没有答案