我以非懒惰的方式在滚动视图上加载图像,因此看不到口吃行为。代码有效,FPS接近60.
但是,我不明白Core Animation的字节对齐(或缓存行对齐)是什么?
如上所述here和here这是一件很重要的事情。但是,我注意到只要我执行here提到的步骤,字节对齐与否并不重要。
任何人都知道究竟是什么?
答案 0 :(得分:9)
当CPU将内存中的内容复制到CPU缓存中时,它会以块的形式进行复制。这些块是缓存行,它们具有固定的大小。当数据存储在CPU缓存中时,它将作为行存储。使数据适合目标体系结构的缓存行大小对性能很重要,因为它会影响数据的局部性。
ARMv7使用32字节缓存行(如PowerPC)。 A9处理器使用64字节高速缓存行。因此,通过渲染为64字节边界的矩形并且具有64字节的倍数,您将看到最大的好处。
另一方面,图形加速器确实更喜欢使用尺寸为2的平方幂的图像数据。这与高速缓存行或字节对齐无关。这是另一件可能对性能产生重大影响的事情。
在您链接的特定情况下,Apple API被调用(Core Animation,QT等)。正在代表调用者执行这些类型的优化。在CoreAnimation的情况下,调用者给它正在为硬件优化的数据。根据Path在您链接的文档中所写的内容,他们建议给予Core Animation数据不必优化(在这种情况下,优化并制作副本)以避免优化步骤。
因此,如果您的图像是维度中64字节的倍数,并且每个维度是2的平方幂,那么您最好去;)将该图像渲染到屏幕上64字节边界的区域是也很好,但除了像游戏这样的全屏幕应用程序之外,其他任何事情都不太现实。
那说,使用仪器。构建您的应用程序,使用Instruments和代表性工作负载对其进行分析(UIAutomation非常适用于此)。如果您看到滚动性能问题,仪器将为您提供所需的一切,以便了解瓶颈所在的位置。
我可以诚实地说,我所看到的所有滚动性能问题都没有涉及字节对齐或缓存行。相反,它是其他形式的核心动画滥用(不使用光栅化和缓存),或在主线程上做太多其他工作等。
中提到了字节对齐对性能影响的指导这是Core Animation在复制时优化图像的格式。如果您已经拥有Core Animation想要的数据,那么它将跳过可能很昂贵的优化步骤。
如果您想了解有关iOS图形管道如何工作的更多信息,请参阅:
WWDC 2012 Session 238 "iOS App Performance: Graphics and Animations"
WWDC 2012 Session 235 "iOS App Performance: Responsiveness"