Python平均使用np数组,csv文件数据

时间:2014-03-09 14:35:35

标签: python arrays numpy

在一个文件夹中,我有许多.csv个文件(计数各不相同),每个文件有5行和1200列数字数据(float)。

现在我想平均这些文件中的数据(即R1C1个文件在结果文件中给出一个平均值,依此类推每个位置(所有文件的R2C2给出一个值结果文件的相同位置等。)。

如何将该文件夹中的所有文件顺序input分成几个数组; numpy中的哪些函数可用于查找已读入这些数组的文件(现在是数组)之间的平均值。有更好的方法吗?对计算机不熟悉,感谢任何帮助。

1 个答案:

答案 0 :(得分:0)

我认为你肯定是在正确的轨道上(因为pythonnumpy是这项任务的绝佳组合),但为了做你想做的事,你需要一些基本的编程技巧。我假设你至少知道一些关于在交互式python shell中工作以及如何导入模块等的问题。:-)

然后,最简单的方法可能只有一个numpy数组:一个包含文件中数据总和的数组。之后,只需要除以你拥有的文件数量。

例如,您可以遵循以下方法:

  • 循环使用for循环和os.listdir方法
  • 的文件夹中的所有文件
  • 检查文件是否属于数据集合,例如使用str.endswith('.csv')
  • 之类的内容
  • 使用os.path.join
  • 将文件名转换为完整路径
  • 使用numpy
  • 将数据读取到numpy.loadtxt数组
  • 将此数据添加到包含总和的数组中,在循环之前使用np.zeros初始化
  • 记录您处理的文件数
  • 循环后
  • ,通过将总和除以处理的文件数来计算均值