如何分析python数据帧并计算字符串在列中出现的次数?

时间:2018-05-09 17:41:03

标签: python dataframe

我有一个python DataFrame,我想分析它。

columns=['User ID','Activity','Time Stamp','X-Axis','Y-Axis','Z-Axis']
input_data = pd.read_csv('walkingcupstairscdownstairs.txt',delimiter=',',names=columns)

输出如下:

enter image description here

Activity栏中有几项活动,例如慢跑,跑步等。我想知道慢跑或走路的次数

3 个答案:

答案 0 :(得分:3)

尝试value_counts

input_data.Activity.value_counts()

示例:

input_data = pd.DataFrame({'Activity': np.random.choice(['Jogging', 'walking'], 10), 
                           'x':np.random.randn(10)})

>>> input_data
  Activity         x
0  walking -0.318043
1  walking -0.590098
2  walking -0.146811
3  Jogging  0.530030
4  Jogging  0.292955
5  walking  0.872765
6  walking  1.028513
7  Jogging -1.465817
8  Jogging  0.981183
9  walking -2.780214

>>> input_data.Activity.value_counts()
walking    6
Jogging    4
Name: Activity, dtype: int64

答案 1 :(得分:1)

尝试使用numpy的独特功能:

import numpy as np
np.unique(input_data['Activity'].values, return_counts=True)

答案 2 :(得分:1)

使用input_data.Activity.value_counts()获取数据框的“活动”列中的每个唯一值及其显示的总次数。

如果您想要更详细地了解唯一值的数量,最高价值,最高价值等,您可以使用input_data.describe()并查看“活动”列的结果。