Question

我想用长文件格式绘制一些测量值的平均值，其中第一列中的所有测量值和第二列中的测试号都是这样的：

A =

bash

我想绘制一条平均所有试验的曲线，所以我需要根据试验数量进行分组，然后取平均值并绘制出来。问题是每次试验的测量次数并不总是相同，并且一些试验缺失，因此试验数量不连续。关于如何做到这一点的任何想法？

编辑：并且通过“平均所有试验”我的意思是我想要每次试验的第一次测量的平均值（这里：0.15），第二次测量的平均值（0.45）等然后绘制曲线遵循这些平均值。

Answer 1

根据ViG的回答，这里使用逻辑索引进行类似的操作。请注意，这个答案并不要求试验有序（即，如果早期试验的结果记录在序列的某个时间后，它仍然有效。）

trialData = importdata('stack.txt'); 
trials = trialData.data(:,1);        % trails
meas = trialData.data(:,2);          % measurements
uniqueTrials = unique(trials);       % unique list of trials
outputMeans = NaN(length(uniqueTrials), 1);  % initialize output to NaN

% take mean for each unique trial
for ii=1:length(uniqueTrials)
    outputMeans(ii) = mean(meas(trials == uniqueTrials(ii)));
end
plot(uniqueTrials, outputMeans);    % plot

Answer 2

让我们概述一下可能符合您需求的不同方法：

1）使用findgroups和splitapply

data = readtable('data.txt','HeaderLines',1);
data.Properties.VariableNames = {'Trials' 'Measurements'};

[G,trials] = findgroups(data.Trials);
means = splitapply(@mean,data.Measurements,G);

result = table(trials,means);
result.Properties.VariableNames = {'Trial' 'AverageMeasurement'};

bar(result.Trial,result.AverageMeasurement);
set(gca,'XTick',min(data.Trials):max(data.Trials));

2）使用unique和arrayfun

data = readtable('data.txt','HeaderLines',1);
data.Properties.VariableNames = {'Trials' 'Measurements'};
data = sortrows(data);

trials_uni = unique(data.Trials);
result = cell2mat(arrayfun(@(x)[x mean(data.Measurements(data.Trials == x))],trials_uni,'UniformOutput',false));

bar(result(:,1),result(:,2));
set(gca,'XTick',min(trials_uni):max(trials_uni));

3）使用accumarray

data = readtable('data.txt','HeaderLines',1);
data.Properties.VariableNames = {'Trials' 'Measurements'};
data = sortrows(data);

[trials_uni,~,trials_idx] = unique(data.Trials);
result = accumarray(trials_idx,data.Measurements,[],@mean);

bar(trials_uni,result);
set(gca,'XTick',min(trials_uni):max(trials_uni));

以下是我用于测试的data.txt内容：

Trial Number   Measurement
1              0.1
1              0.5
1              0.7
1              0.3
1              0.2
2              0.2
2              0.4
2              0.5
4              0.2
4              0.1
7              0.8
7              0.4
7              0.5
7              0.4

这是最终输出：

如果你想要累积均值，那么hwre是如何计算的：

data = readtable('data.txt','HeaderLines',1);
data.Properties.VariableNames = {'Trials' 'Measurements'};
data = sortrows(data);

cm = cumsum(data.Measurements) ./ (1:height(data)).':

plot(data.Trials,cm);

如果您想通过试验索引对累积均值进行子集化，您可以使用以前的方法之一。

如果您想要计算每个组的累积平均值，您可以使用上述方法之一按索引拆分数据，然后计算每个组的累积平均值。

Answer 3

您可以这样做：

data = importdata('stack.txt');                                             % import data
trails = data.data(:,1);                                                    % trails
meas = data.data(:,2);                                                      % measurments                                                   
[~,idx] = ismember(trails, trails);                                         % get indices of new trails
trails = unique(trails);                                                    % only save uniques
idx = unique(idx);                                                          % only save uniques
meass = zeros(length(idx),1);                                               % allocate memory

for i=1:length(idx)-1
    meass(i) = mean(meas(idx(i):idx(i+1)-1));                               % save average of each trail
end
meass(end) = mean(meas(idx(end):end));                                      % last trail

plot(trails,meass)                                                          % plot

Matlab：沿列绘制平均值，通过运行索引进行子集化

3 个答案: