如何从excel电子表格中提取某些信息?

时间:2017-11-15 02:01:32

标签: python excel python-3.x readlines

我是python的新手,想学习如何从数据表中提取某些元素。例如:

  1. 数据有多少属性/类别?
  2. 数据有多少缺失值?
  3. 数据有多少列?
  4. 单列中元素的频率
  5. 我已经打印了数据,但我想知道如何通过while循环或for循环计算上述值

    file=open('9car.csv','r')
    
    M=[]
    lines=file.readlines()
    for row in lines:
         value=row.strip()
         items=value.split()
         # print(items)
         print(value)
         # print(values)
    
    for row in M:
         count=len(row)
         print(count)
    

2 个答案:

答案 0 :(得分:0)

对于回答这些问题,大熊猫将是一个更好,更方便的选择。

import pandas as pd
df = pd.read_csv('9car.csv')
1. df['col_name'].unique()
2. pd.isnull(df['col_name']).sum()
3. len(df.columns)
4. df['col_name'].value_count()

答案 1 :(得分:0)

标准库(在python.org上为您的python版本记录)包含一个名为csv的模块。它有许多用于解析csv文件的函数。对于您而言,这可能比尝试从头开始读取和解析每一行更好。