我的目标是用一个数据帧的字段中的值制作一个直方图。说:
df = pd.read_csv('file.csv')
然后从df ['field']开始,我可以通过以下方式获得其唯一的可能值:
V_field = {v for v in df['field']} #unique because is a set
我可以算出每种有价值的事情的数量:
V1 = [j for j in df['field'] if j ==v1]
...
Vn = [j for i in df[´field] if j == vn]
其中vi是V_field中的唯一值。 然后我可以算出在len(Vi)的df ['field']中出现vi的次数
这里的问题是我非常手动地执行此操作,并且可能会发生len(V_field)非常大(我正在处理大数据)的情况。有没有其他方法可以实现这个目标?我当时想在V_field中做一个for循环。像这样:
List = []
for v in V_field:
v = [i for i in df['field] if i == v]
List.append(v)
但是我相信它可能会引发错误。
我需要为我正在做的工作设定相对频率。
谢谢您的回答。我对python很陌生。