在统计信息中使用Python,matplotlib和pandas的函数

时间:2019-07-03 08:43:42

标签: python pandas numpy matplotlib

我必须使用Python,Matplotlib和Pandas完成这些操作。

  • 读取CSV文件,其中用“,”和小数点分隔
  • 计算文件的所有行
  • 用同一文件的列年的值绘制条形图
  • 找到一列所有值的期望值
  • 找到四分位数(使用Python和他的库)。
  • 找到合适的样本量。

我要问的是,做这些事情的最佳方法/功能是什么? 我唯一想写的就是这个。

pd.read_csv('pandas_tutorial_read.csv', delimiter=';')

这里的问题与我必须做的非常相似。

https://www.dropbox.com/sh/sy7vqq2x2740u9d/AACFap-NPA04znDMNX5W9wdza?dl=0

谢谢!

1 个答案:

答案 0 :(得分:0)

要读取csv,可以使用此代码。如果输入文件用逗号分隔,则不需要定界符。

df = pd.read_csv('path')

要计算所有行,请使用df的shape属性。

rows = df.shape[0]

要绘制条形图,请使用它。

import matplotlib.pyplot as plt

plt.bar(col1,col2)

如果用“期望值”表示递减值,请使用Imputer。您可以在线找到文档。

可以像这样进行量化。

df[col].quantile([0,0.25,0.5,0.75])

无法理解“样本量”的意思。

那里有大量的文档和教程。祝一切顺利!