画布上大约有12万颗颗粒?

时间:2018-01-19 20:24:31

标签: javascript html5 canvas html5-canvas particles

我有大约120 000个粒子(每个粒子1像素大小),我需要找到最好和最重要的:画到画布的最快方法。

你会怎么做?

现在我基本上把我的像素放到一个数组中,然后我循环遍历这些粒子,进行一些x和y计算并使用fillRect绘制它们。但帧速率现在就像是8-9 fps。

有什么想法吗?请举例。

谢谢

最新更新(我的代码)

function init(){

    window.addEventListener("mousemove", onMouseMove);

    let mouseX, mouseY, ratio = 2;

    const canvas = document.getElementById("textCanvas");
    const context = canvas.getContext("2d");
    canvas.width = window.innerWidth * ratio;
    canvas.height = window.innerHeight * ratio;

    canvas.style.width = window.innerWidth + "px";
    canvas.style.height = window.innerHeight + "px";

    context.imageSmoothingEnabled = false;
    context.fillStyle = `rgba(255,255,255,1)`;
    context.setTransform(ratio, 0, 0, ratio, 0, 0);

    const width = canvas.width;
    const height = canvas.height;

    context.font = "normal normal normal 232px EB Garamond";
    context.fillText("howdy", 0, 160);

    var pixels = context.getImageData(0, 0, width, height).data;
    var data32 = new Uint32Array(pixels.buffer);

    const particles = new Array();

    for(var i = 0; i < data32.length; i++) {

        if (data32[i] & 0xffff0000) {
            particles.push({
                x: (i % width),
                y: ((i / width)|0),
                ox: (i % width),
                oy: ((i / width)|0),
                xVelocity: 0,
                yVelocity: 0,
                a: pixels[i*4 + 3] / 255
            });
        }
    }

    /*const particles = Array.from({length: 120000}, () => [
        Math.round(Math.random() * (width - 1)),
        Math.round(Math.random() * (height - 1))
    ]);*/

    function onMouseMove(e){
        mouseX = parseInt((e.clientX-canvas.offsetLeft) * ratio);
        mouseY = parseInt((e.clientY-canvas.offsetTop) * ratio);
    }

    function frame(timestamp) {

        context.clearRect(0, 0, width, height);
        const imageData = context.getImageData(0, 0, width, height);
        const data = imageData.data;
        for (let i = 0; i < particles.length; i++) {
            const particle = particles[i];
            const index = 4 * Math.round((particle.x + particle.y * width));

            data[index + 0] = 0;
            data[index + 1] = 0;
            data[index + 2] = 0;
            data[index + 3] = 255;
        }
        context.putImageData(imageData, 0, 0);

        for (let i = 0; i < particles.length; i++) {
            const p = particles[i];

            var homeDX = p.ox - p.x;
            var homeDY = p.oy - p.y;

            var cursorForce = 0;
            var cursorAngle = 0;

            if(mouseX && mouseX > 0){
                var cursorDX = p.ox - mouseX;
                var cursorDY = p.oy - mouseY;
                var cursorDistanceSquared = (cursorDX * cursorDX + cursorDY * cursorDY);
                cursorForce = Math.min(10/cursorDistanceSquared,10);

                cursorAngle = -Math.atan2(cursorDY, cursorDX);
            }else{
                cursorForce = 0;
                cursorAngle = 0;
            }

            p.xVelocity += 0.2 * homeDX + cursorForce * Math.cos(cursorAngle);
            p.yVelocity += 0.2 * homeDY + cursorForce * Math.sin(cursorAngle);

            p.xVelocity *= 0.55;
            p.yVelocity *= 0.55;

            p.x += p.xVelocity;
            p.y += p.yVelocity;
        }
        requestAnimationFrame(frame);
    }

    requestAnimationFrame(frame);
}

2 个答案:

答案 0 :(得分:2)

webgl上下文中的着色器中计算这些粒子将提供最高性能的解决方案。见e。 G。 https://www.shadertoy.com/view/MdtGDX举个例子。

如果您希望继续使用2d上下文,则可以通过屏幕外操作加快渲染粒子:

  1. 通过调用context.getImageData()
  2. 获取图像数据数组
  3. 通过操纵数据阵列绘制像素
  4. 将数据数组放回context.putImageData()
  5. 简化示例:

    const output = document.getElementById("output");
    const canvas = document.getElementById("canvas");
    const context = canvas.getContext("2d");
    const width = canvas.width;
    const height = canvas.height;
    
    const particles = Array.from({length: 120000}, () => [
      Math.round(Math.random() * (width - 1)),
      Math.round(Math.random() * (height - 1))
    ]);
    
    let previous = 0;
    function frame(timestamp) {
      // Print frames per second:
      const delta = timestamp - previous;
      previous = timestamp;
      output.textContent = `${(1000 / delta).toFixed(1)} fps`;
      
      // Draw particles:
      context.clearRect(0, 0, width, height);
      const imageData = context.getImageData(0, 0, width, height);
      const data = imageData.data;
      for (let i = 0; i < particles.length; i++) {
        const particle = particles[i];
        const index = 4 * (particle[0] + particle[1] * width);
        data[index + 0] = 0;
        data[index + 1] = 0;
        data[index + 2] = 0;
        data[index + 3] = 255;
      }
      context.putImageData(imageData, 0, 0);
      
      // Move particles randomly:
      for (let i = 0; i < particles.length; i++) {
        const particle = particles[i];
        particle[0] = Math.max(0, Math.min(width - 1, Math.round(particle[0] + Math.random() * 2 - 1)));
        particle[1] = Math.max(0, Math.min(height - 1, Math.round(particle[1] + Math.random() * 2 - 1)));
      }
      requestAnimationFrame(frame);
    }
    
    requestAnimationFrame(frame);
    <canvas id="canvas" width="500" height="500"></canvas>
    <output id="output"></output>

    除了绘制单个像素外,您可能还需要考虑绘制和移动一些纹理,每个纹理上都有很多粒子。这可能接近完整的粒子效果,以获得更好的性能。

答案 1 :(得分:2)

每秒移动7.2万个粒子

不使用webGL和着色器,你想要每帧120K粒子 60fps,你需要每秒720万点的吞吐量。你需要一台快速的机器。

Web worker多核CPU

快速解决方案。在多核机器上,Web工作者为每个硬件核心提供线性性能提升。例如,在8 Core i7上,您可以运行7名工作人员通过sharedArrayBuffers共享数据(由于CPU安全风险,{3由于CPU安全风险见MDN sharedArrayBuffer而感到羞耻)并且性能提升略低于7倍。注意,好处只来自实际的硬件内核,JS线程往往会耗尽,在一个内核中运行两个worker会导致整体吞吐量下降。

即使启用了共享缓冲区,如果您可以控制运行的硬件,它仍然是一个可行的解决方案。

制作电影。

LOL但不是它的选项,并且粒子数没有上限。虽然没有我认为你想要的那么互动。如果你通过FX卖东西,你是在哇,而不是如何?

优化

容易说难做。你需要用细齿梳子来检查代码。请记住,如果全速运行,删除一行是每秒删除720万行。

我再次检查了代码。我无法测试它,所以它可能会或可能不会工作。但它给你的想法。你甚至可以考虑使用整数数学。 JS可以做定点数学。即使是4K显示器,整数大小也比你需要的大32位。

第二次优化传递。

// call this just once outside the animation loop.
const imageData = this.context.getImageData(0, 0, this.width * this.ratio, this.height * this.ratio);
// create a 32bit buffer
const data32 = new Uint32Array(imageData.data.buffer);
const pixel = 0xFF000000; // pixel to fill
const width = imageData.width;


// inside render loop
data32.fill(0); // clear the pixel buffer

// this line may be a problem I have no idea what it does. I would
// hope its only passing a reference and not creating a copy 
var particles = this.particleTexts[0].getParticles();

var cDX,cDY,mx,my,p,cDistSqr,cForce,i;
mx = this.mouseX | 0; // may not need the floor bitwize or 0
my = this.mouseY | 0; // if mouse coords already integers

if(mX > 0){  // do mouse test outside the loop. Need loop duplication
             // But at 60fps thats 7.2million less if statements
    for (let i = 0; i < particles.length; i++) {
        var p = particles[i];
        p.xVelocity += 0.2 * (p.ox - p.x);
        p.yVelocity += 0.2 * (p.oy - p.y);
        p.xVelocity *= 0.55;
        p.yVelocity *= 0.55;
        data32[((p.x += p.xVelocity) | 0) + ((p.y += p.yVelocity) | 0) * width] = pixel;
    }
}else{
    for (let i = 0; i < particles.length; i++) {
        var p = particles[i];
        cDX = p.x - mx;
        cDY = p.y - my;
        cDist = Math.sqrt(cDistSqr = cDX*cDX + cDY*cDY + 1);
        cForce = 1000 / (cDistSqr * cDist)
        p.xVelocity += cForce * cDx +  0.2 * (p.ox - p.x);
        p.yVelocity += cForce * cDY +  0.2 * (p.oy - p.y);
        p.xVelocity *= 0.55;
        p.yVelocity *= 0.55;
        data32[((p.x += p.xVelocity) | 0) + ((p.y += p.yVelocity) | 0) * width] = pixel;

    }
}
// put pixel onto the display.
this.context.putImageData(imageData, 0, 0);

以上就像我可以减少它一样多。 (不能测试它可能或可能不适合你的需要)它可能会给你一秒钟的帧数。

交织

另一种解决方案可能适合您,那就是欺骗眼睛。这会增加帧速率但不会增加处理的点数,并且要求点随机分布或者工件将非常明显。

每帧只处理一半粒子。每次处理粒子时,都要计算像素索引,设置该像素,然后将像素速度添加到像素索引和粒子位置。

效果是每个框架只有一半的粒子在力的作用下移动而另一半的粒子在一帧中移动。

这可能会使帧速率加倍。如果您的粒子非常有条理并且您会聚集闪烁类型的伪影,则可以通过在创建时对粒子阵列应用随机shuffle来随机化粒子的分布。这需要良好的随机分布。

下一个片段就是一个例子。每个粒子需要将pixelIndex保持在像素data32数组中。请注意,第一帧需要是一个完整的帧来设置所有索引等。

    const interleave = 2; // example only setup for 2 frames
                          // but can be extended to 3 or 4

    // create frameCount outside loop
    frameCount += 1;

    // do half of all particals
    for (let i = frameCount % frameCount  ; i < particles.length; i += interleave ) {
        var p = particles[i];
        cDX = p.x - mx;
        cDY = p.y - my;
        cDist = Math.sqrt(cDistSqr = cDX*cDX + cDY*cDY + 1);
        cForce = 1000 / (cDistSqr * cDist)
        p.xVelocity += cForce * cDx +  0.2 * (p.ox - p.x);
        p.yVelocity += cForce * cDY +  0.2 * (p.oy - p.y);
        p.xVelocity *= 0.55;
        p.yVelocity *= 0.55;

        // add pixel index to particle's property 
        p.pixelIndex = ((p.x += p.xVelocity) | 0) + ((p.y += p.yVelocity) | 0) * width;
        // write this frames pixel
        data32[p.pixelIndex] = pixel;

        // speculate the pixel index position in the next frame. This need to be as simple as possible.
        p.pixelIndex += (p.xVelocity | 0) + (p.yVelocity | 0) * width;

        p.x += p.xVelocity;  // as the next frame this particle is coasting
        p.y += p.yVelocity;  // set its position now
     }

     // do every other particle. Just gets the pixel index and sets it
     // this needs to remain as simple as possible.
     for (let i = (frameCount + 1) % frameCount  ; i < particles.length; i += interleave)
         data32[particles[i].pixelIndex] = pixel;
     }

更少的颗粒

接缝明显,但往往被认为是一个可行的解决方案。较少的粒子并不意味着较少的视觉元素/像素。

如果将粒子数减少8并在设置时创建一个大的偏移量索引缓冲区。这些缓冲区保存与像素行为紧密匹配的动画像素移动。

这可能是非常有效的,并且给出了每个像素实际上是独立的错觉。但是这项工作是在预处理和设置偏移动画。

例如

   // for each particle after updating position
   // get index of pixel

   p.pixelIndex = (p.x | 0 + p.y | 0) * width;
   // add pixel
   data32[p.pixelIndex] = pixel;

   // now you get 8 more pixels for the price of one particle 
   var ind = p.offsetArrayIndex; 
   //  offsetArray is an array of pixel offsets both negative and positive
   data32[p.pixelIndex + offsetArray[ind++]]  = pixel;
   data32[p.pixelIndex + offsetArray[ind++]]  = pixel;
   data32[p.pixelIndex + offsetArray[ind++]]  = pixel;
   data32[p.pixelIndex + offsetArray[ind++]]  = pixel;
   data32[p.pixelIndex + offsetArray[ind++]]  = pixel;
   data32[p.pixelIndex + offsetArray[ind++]]  = pixel;
   data32[p.pixelIndex + offsetArray[ind++]]  = pixel;
   data32[p.pixelIndex + offsetArray[ind++]]  = pixel;
   // offset array arranged as sets of 8, each set of 8 is a frame in 
   // looping pre calculated offset animation
   // offset array length is 65536 or any bit mask able size.
   p.offsetArrayIndex = ind & 0xFFFF ; // ind now points at first pixel of next
                                       // set of eight pixels

这和其他类似的技巧可以为你提供你想要的每秒720万像素。

最后一点。

记住现在每台设备都有专用的GPU。你最好的选择是使用它,这种类型的东西是他们擅长的。