熊猫,添加新的计数列

时间:2017-11-19 02:46:36

标签: python pandas pandas-groupby

为了使问题易于理解,我的问题是我想计算一些变量的数量,这里是我的测试代码和输出

page = requests.get('https://www.census.gov/programs-surveys/popest.html')
print(page.status_code)
soup = BeautifulSoup(page.text, 'html.parser')
csvfile = open('code_python.csv', 'w+', newline='')
writer = csv.writer(csvfile)
writer.writerow(['Links'])
for link in soup.find_all('a'):
    web_links = link.get("href")
    if web_links:
        print(web_links)
        writer.writerow([web_links])
csvfile.close()

我想要像这样的输出

>>> g = df_data[['COUNTRY', 'STATE', 'CITY']].groupby(
    ['COUNTRY', 'STATE', 'CITY'])['COUNTRY'].count()
>>> g
COUNTRY    STATE     CITY
2          10.0      0.0           56643
                     40.0             18
                     60.0            596
                     nan             131
           11.0      0.0              20
           12.0      0.0               5
           13.0      0.0               7
Name: COUNTRY, dtype: int64

我该怎么做?

2 个答案:

答案 0 :(得分:1)

似乎你需要

df_data[['COUNTRY', 'STATE', 'CITY']].\
     groupby(['COUNTRY', 'STATE', 'CITY']).\
          size().\
            reset_index(name='count')

答案 1 :(得分:0)

我认为您需要reset_index()方法。

g.reset_index()