遇到熊猫问题,我的dataframe value_counts调用返回相同值的多行。而不是将所有“ True”值和所有“ False”值分组,而是将它们分为4组。
这是我的代码:
import pandas as pd
filepath=r"C:\Users\09.41.csv"
df = pd.read_csv(filepath)
print(df['Finished'].value_counts())
输出:
真3904
真正的1877
错误190
错误94
我希望能够将所有“ True”和“ False”响应分组在一起进行分析,但是我一直陷于这4组而不是2组。
运行Python 3.7.4和CSV直接来自调查软件(Qualtrics)。
在此先感谢您的帮助!
答案 0 :(得分:2)
检查您的值数据类型。有些行可能是字符串,有些行可能是布尔。例如:
[True,'True','False',False,False]
如果是这种情况,请将其全部更改为bool,然后计算值:
df.Finished.apply(lambda x: 'True' in x if type(x)!= bool else x).value_counts()