在python

时间:2016-03-12 10:45:24

标签: python machine-learning scikit-learn classification accelerometer

我在4种不同类型的事件(以及每种事件的多次重复)之后有一组加速度计数据记录。 每个点(记录)由3个矢量(X,Y,Z)定义,每个矢量150,000个样本(5秒,采样率为30KHz)。总而言之,我有很多3x150,000个矩阵。

我想使用python为这些点使用分类器或聚类,以查看在不同类型的事件之后加速度计的行为是否存在差异。

  1. 什么是最好的分类器?
  2. 我应该如何构建数据?
  3. 如何绘制此图以便可视化我的数据?
  4. 非常感谢任何帮助者。

1 个答案:

答案 0 :(得分:1)

很难给出关于在数据存储方面应该做些什么的确切指示。我想你已经弄清楚了吗?如果不是全部取决于各种参数,例如读/写访问频率,数据大小和其他内容,例如DAQ系统。就此而言,我认为这已经解决,数据已经以某种方式记录和存储。它可以是csv文件,数据库或自定义文件格式。只要你能阅读它,它就没关系了。

使用pandas构建数据。它是numpy的包装,描述为:

  pandas是一个开源的,获得BSD许可的库,为Python编程语言提供高性能,易于使用的数据结构和数据分析工具。

对于绘图,由于您似乎正在进行统计分析,因此可以使用matplotlib进行基本绘图,或使用seaborn进行聚类和统计分析等。来自Seaborn网站:

  

Seaborn是一个基于matplotlib的Python可视化库。它提供了一个高级界面,用于绘制有吸引力的统计图形。

查看Seaborn gallery,了解可能的情节。它对库可能的图表以及该图表所需的源代码进行了很好的概述。