如何在顶点/片段着色器(金属)

时间:2015-08-10 17:23:50

标签: ios shader texture-mapping metal

我有一个简单的任务,但显然我仍然不明白投影在着色器中是如何工作的。我需要在纹理四边形(2个三角形)上进行2D透视变换,但在视觉上它看起来不正确(例如梯形比CPU版本略高或拉伸得多)。

我有这个结构:

struct VertexInOut  
{  
  float4 position [[position]];  
  float3 warp0;  
  float3 warp1;  
  float3 warp2;  
  float3 warp3;  
};  

在顶点着色器中,我执行的操作(texCoords是四角的像素坐标,单应像是以像素坐标计算的):

v.warp0 = texCoords[vid] * homographies[0]; 

然后在片段着色器中这样:

return intensity.sample(s, inFrag.warp0.xy / inFrag.warp0.z);

结果不是我所期望的。我花了好几个小时,但我无法弄清楚。 通气

更新

这些是CPU的代码和结果(又名预期结果):

// _image contains the original image
cv::Matx33d h(1.03140473, 0.0778113901, 0.000169219566,
              0.0342947133, 1.06025684, 0.000459250761,
              -0.0364957005, -38.3375587, 0.818259298);
cv::Mat dest(_image.size(), CV_8UC4);
// h is transposed because OpenCV is col major and using backwarping because it is what is used on the GPU, so better for comparison
cv::warpPerspective(_image, dest, h.t(), _image.size(), cv::WARP_INVERSE_MAP | cv::INTER_LINEAR);  

warped by cpu

这些是GPU的代码和结果(又名错误的结果):

// constants passed in buffers, image size 320x240
const simd::float4 quadVertices[4] =
{
  { -1.0f,  -1.0f, 0.0f, 1.0f },
  { +1.0f,  -1.0f, 0.0f, 1.0f },
  { -1.0f,  +1.0f, 0.0f, 1.0f },
  { +1.0f,  +1.0f, 0.0f, 1.0f },
};

const simd::float3 textureCoords[4] =
{
  { 0,  IMAGE_HEIGHT, 1.0f },
  { IMAGE_WIDTH, IMAGE_HEIGHT, 1.0f },
  { 0, 0, 1.0f },
  { IMAGE_WIDTH, 0, 1.0f },
};

// vertex shader
vertex VertexInOut homographyVertex(uint vid [[ vertex_id ]],
                                    constant float4 *positions [[ buffer(0) ]],
                                    constant float3 *texCoords [[ buffer(1) ]],
                                    constant simd::float3x3 *homographies [[ buffer(2) ]])
{
  VertexInOut v;
  v.position = positions[vid];

  // example homography
  simd::float3x3 h = {
    {1.03140473, 0.0778113901, 0.000169219566},
    {0.0342947133, 1.06025684, 0.000459250761},
    {-0.0364957005, -38.3375587, 0.818259298}
  };

  v.warp = h * texCoords[vid];

  return v;
}

// fragment shader
fragment int4 homographyFragment(VertexInOut inFrag [[stage_in]],
                                 texture2d<uint, access::sample> intensity [[ texture(1) ]])
{
  constexpr sampler s(coord::pixel, filter::linear, address::clamp_to_zero);
  float4 targetIntensity = intensityRight.sample(s, inFrag.warp.xy / inFrag.warp.z);
  return targetIntensity;
}

enter image description here

原始图片:

original image

更新2:

与普遍认为透视分割应该在片段着色器中完成相反,如果我在顶点着色器中划分(并且三角形之间没有扭曲或接缝),我得到的更类似的结果,但为什么呢?

enter image description here

更新3:

如果符合以下条件,我会得到相同(错误)的结果:

  • 我将透视分割移动到片段着色器
  • 我只是删除了代码中的区别

很奇怪,看起来并没有发生分歧。

1 个答案:

答案 0 :(得分:2)

好的,解决方案当然是一个非常小的细节:simd::float3分区表现得绝对疯狂。事实上,如果我在片段着色器中进行透视划分,就像这样:

float4 targetIntensity = intensityRight.sample(s, inFrag.warp.xy * (1.0 / inFrag.warp.z));

它有效!

这让我发现乘以预先划分的浮点数与除以浮点数不同。如果有人知道为什么我们可以解开这个谜团,那么我的原因仍然是未知的。