Question

我对矢量化有点新意。已经尝试过但不能。有人可以帮助我对这段代码进行矢量化，并简要说明你是如何做到这一点的，这样我就可以适应思维过程。谢谢。

function [result] = newHitTest (point,Polygon,r,tol,stepSize)
%This function calculates whether a point is allowed.

%First is a quick test is done by calculating the distance from point to 
%each point of the polygon. If that distance is smaller than range "r", 
%the point is not allowed. This will slow down the algorithm at some 
%points, but will greatly speed it up in others because less calls to the 
%circleTest routine are needed.
polySize=size(Polygon,1);
testCounter=0;

for i=1:polySize
d = sqrt(sum((Polygon(i,:)-point).^2));

if d < tol*r
    testCounter=1;
    break
end
end

if testCounter == 0
circleTestResult = circleTest (point,Polygon,r,tol,stepSize);
testCounter = circleTestResult;
end

result = testCounter;

Answer 1

鉴于Polygon是2维的信息，point是行向量而其他变量是标量，这是新函数的第一个版本（向下滚动以查看有很多皮肤这种猫的方法）：

function [result] = newHitTest (point,Polygon,r,tol,stepSize)
result = 0;
linDiff = Polygon-repmat(point,size(Polygon,1),1);
testLogicals = sqrt( sum( ( linDiff ).^2 ,2 )) < tol*r;    
if any(testLogicals); result = circleTest (point,Polygon,r,tol,stepSize); end

Matlab中矢量化的思维过程涉及尝试使用单个命令尽可能多地操作数据。大多数基本的内置Matlab函数在多维数据上运行非常有效。使用for循环与此相反，因为您要将数据分解为较小的段以进行处理，每个段都必须单独解释。通过使用for循环求助数据，您可能会失去与Matlab内置函数背后的高度优化代码相关的一些巨大性能优势。

在您的示例中要考虑的第一件事是主循环中的条件中断。你无法摆脱矢量化过程。相反，计算所有可能性，为数据的每一行创建结果数组，然后使用any关键字查看是否有任何行已发出信号表示应调用circleTest函数。

注意：在Matlab中有效地有条件地打破计算是不容易的。但是，由于您只是在循环中计算欧几里德距离的形式，您可能会通过使用矢量化版本并计算所有可能性来看到性能提升。如果你的循环中的计算更昂贵，输入数据很大，并且你想在遇到某个条件时立即爆发，那么用编译语言编写的matlab扩展可能比矢量化版本快得多。你可能正在进行不必要的计算。但是，假设您知道如何使用编译为本机代码的语言编写与Matlab内置函数的性能相匹配的代码。

回到主题......

要做的第一件事是在linDiff和行向量Polygon之间取线性差异（代码示例中为point）。要以矢量化方式执行此操作，2个变量的维度必须相同。实现此目的的一种方法是使用repmat复制point的每一行，使其与Polygon的大小相同。但是，bsxfun通常是repmat（as described in this recent SO question）的高级替代品，使代码成为......

function [result] = newHitTest (point,Polygon,r,tol,stepSize)
result = 0;
linDiff = bsxfun(@minus, Polygon, point);
testLogicals = sqrt( sum( ( linDiff ).^2 ,2 )) < tol*r;    
if any(testLogicals); result = circleTest (point,Polygon,r,tol,stepSize); end

我通过对第二个轴进行求和将d值转换为d列（请注意从Polygon删除数组索引并添加,2在sum命令中。然后我进一步评估逻辑数组testLogicals内联计算距离度量。您很快就会发现重载矢量化的缺点是它可以使代码对于不熟悉Matlab的人来说更不易读，但性能提升是值得的。评论是非常必要的。

现在，如果你想完全疯狂，你可以说测试功能现在非常简单，它保证使用'匿名函数'或'lambda'而不是完整的函数定义。是否值得执行circleTest的测试也不需要stepSize参数，这可能是使用匿名函数的另一个原因。您可以将测试转换为匿名函数，然后在调用脚本中使用circleTest，使代码在某种程度上自我记录。。。

doCircleTest = @(point,Polygon,r,tol) any(sqrt( sum( bsxfun(@minus, Polygon, point).^2, 2 )) < tol*r);

if doCircleTest(point,Polygon,r,tol)
    result = circleTest (point,Polygon,r,tol,stepSize); 
else
    result = 0;
end

现在一切都是矢量化的，使用函数句柄给了我另一个想法。。。

如果您计划在代码中的多个点执行此操作，if语句的重复会变得有点难看。要保持dry，将条件函数的测试放入单个函数中似乎是明智的，就像在原始帖子中一样。但是，该函数的效用将非常狭窄 - 它只会测试是否应该执行circleTest函数，然后在需要时执行它。

现在想象一下，过了一段时间，你有一些其他的条件函数，就像circleTest一样，它们等同于doCircleTest。很可能重用条件切换代码。为此，创建一个类似于原始函数的函数，它采用默认值，计算上廉价的测试函数的布尔结果，以及昂贵的条件函数及其相关参数的函数句柄......

function result = conditionalFun( default, cheapFunResult, expensiveFun, varargin )
if cheapFunResult
    result = expensiveFun(varargin{:});
else
    result = default;
end
end %//of function

您可以使用以下命令从主脚本中调用此函数。。。

result = conditionalFun(0, doCircleTest(point,Polygon,r,tol), @circleTest, point,Polygon,r,tol,stepSize);

...它的美妙之处在于你可以使用任何测试，默认值和昂贵的功能。对于这个简单的例子来说可能有点过分，但是当我提出使用函数句柄的想法时，我的思绪就会徘徊。

matlab代码的矢量化

1 个答案: