Question

我的数据框有两列SESSION和PRICE_POINT。

SESSION是一个类别变量（具有各种ip会话的值）

PRICE_POINT有两个值，例如＆＃39; high＆＃39;，＆＃39; low＆＃39;

我正在运行以下内容：

n = pd.value_counts(df['price_point'].values, sort=False)

我的输出是，

high    30204
low     62978
dtype: int64

我需要的是，我想得到＆＃34;高＆＃34;和＆＃34;低＆＃34;来自专栏＆＃34; price_point＆＃34;单独存储，并将该值存储为n = 30204和m = 62978。

有什么想法吗？

Answer 1

怎么样：

n = df.price_point.value_counts().high
m = df.price_point.value_counts().low

df = pd.DataFrame(data={'price':['high', 'high', 'low', 'low', 'low', 'low']})
df.price.value_counts().high

2

或分两步：

counts = df.price_point.value_counts()
n = counts.high

Answer 2

IIUC然后您只需使用值索引系列，例如：

In [94]:
df = pd.DataFrame({'col1':['high','high','low','low','low','low']})
df['col1'].value_counts()

Out[94]:
low     4
high    2
Name: col1, dtype: int64

In [96]:
counts.index

Out[96]:
Index(['low', 'high'], dtype='object')

In [97]:    
counts = df['col1'].value_counts()
print('high: ', counts['high'], 'low: ', counts['low'])

high:  2 low:  4

将特定值的计数存储在Pandas数据帧的列中

2 个答案: