在处理(大/增长)数据时,为什么要使用外部数据库(例如Mysql)?
我知道一些使用SQL数据库的项目,但是我不能看到这样做的好处,而只是将所有内容存储在.mat文件中(例如:http://www.matlabtips.com/how-to-store-large-datasets/)< / p>
这在哪里必要?这种方法在哪里简化了事情?
答案 0 :(得分:3)
关于增长数据,让我们举一个例子,在生产线上,您将使用不同的传感器测量不同的来源:
Experiment.Date = '2014-07-18 @ 07h28';
Experiment.SensorType = 'A';
Experiment.SensorSerial = 'SENSOR-00012-A';
Experiment.SourceType = 'C';
Experiment.SourceSerial = 'SOURCE-00143-C';
Experiment.SensorPositions = 180 * linspace(0, 359, 360) / pi;
Experiment.SensorResponse = rand(1, 360);
使用.mat文件将这些实验存储在磁盘上:
experiment.2013-01-02.0001.mat
experiment.2013-01-02.0002.mat
experiment.2013-01-02.0003.mat
experiment.2013-01-03.0004.mat
...
experiment.2014-07-18.0001.mat
experiment.2014-07-18.0002.mat
现在,如果我问你:
B
&#34时,E
类型传感器的典型响应是什么? ? 或者:
C
类型的来源?传感器A
或传感器B
?&#34; A
?&#34; 在内存中加载所有这些.mat
文件,以检查日期,传感器和源类型是否正确,然后计算最小值,平均值,最大响应和其他统计数据将非常痛苦且耗时+编写自定义文件选择的代码!
在这些.mat文件之上构建数据库对于&#34; SELECT / JOIN /..."非常有用。感兴趣的元素,然后进行进一步的统计或操作。
注意:数据库不会替换.mat文件(即信息),它只是一种实用且标准的方法,可以在条件下快速选择其中一些而无需加载和解析所有内容。