硬件加速h.264解码到iOS中的纹理,叠加或类似

时间:2012-05-18 04:19:03

标签: iphone ios opengl-es h.264

是否可以并且支持使用iOS硬件加速的h.264解码API来解码本地(非流式)视频文件,然后在其上组合其他对象?

我想创建一个涉及在视频前面绘制图形对象的应用程序,并使用回放计时器来同步我在顶部绘制的内容,以及在视频上播放的内容。然后,根据用户的操作,更改我在顶部绘制的内容(但不是视频)

来自Android的DirectX,OpenGL和OpenGL ES,我想象的是将视频呈现为纹理,并使用该纹理绘制全屏四边形,然后使用其他精灵来绘制其余对象;或者也许在渲染器之前写一个中间过滤器,这样我就可以操纵各个输出帧并绘制我的东西;或者可以在视频顶部绘制2D图层。

似乎AV基金会或核心媒体可以帮助我做我正在做的事情,但在我深入研究细节之前,我想知道是否有可能做什么我想做,我解决问题的主要途径是什么。

请不要“这对你来说太先进,先试试你好世界”的答案。我知道我的东西,只是想知道我想做什么是可能的(最重要的是,支持,所以应用程序不会最终被拒绝),在我自己研究细节之前。

编辑:

我对iOS开发并不了解,但专业的Android版DirectX,OpenGL和OpenGL ES。我正在考虑制作我目前拥有的Android应用程序的iOS版本,我只是想知道这是否可行。如果是这样,我有足够的时间从头开始iOS开发,直到做我想做的事情。如果不可能,那么我现在不会花时间研究整个平台。

因此,这是一个技术可行性问题。我不是要求代码。我正在寻找类型的答案“是的,你可以做到这一点。只需使用A和B,使用C渲染到D并用E绘制你的东西”,或者“不,你不能。硬件加速解码是不适用于第三方应用程序“(这是朋友告诉我的)。就这样,我会在路上。

我已阅读ios technology overview第32页的视频技术概述。它几乎说我可以使用Media Player获得最简单的播放功能(不是我正在寻找的),UIKit用于嵌入视频,对嵌入有更多的控制,但不是实际播放(不是我的'我正在寻找),AVFoundation可以更好地控制播放(也许我需要的,但我在网上找到的大部分资源都是关于如何使用相机),或者是Core Media对视频进行全面的低级控制(可能就是我需要,但extremely poorly documented,甚至比播放AVFoundation更缺乏播放资源。)

我担心我可能会在接下来的六个月里全身心投入学习iOS编程,但最终却发现相关API不适用于第三方开发人员,而我想做的事情对于iTu​​nes商店来说是不可接受的部署。这是我的朋友告诉我的,但我似乎无法在应用程序开发指南中找到任何相关内容。因此,我来​​到这里是为了询问那些在这方面有更多经验的人,不管我想做什么都是可能的。没有了。

我认为这是一个有效的高级问题,可以被误解为我不做我的作业 - plz-give-me-teh-codez问题。如果我在这里的判断是错误的,请随意删除,或者将这个问题贬低到你心中的蔑视。

1 个答案:

答案 0 :(得分:25)

是的,你可以这样做,我认为你的问题具体到足以属于这里。你并不是唯一一个想要做到这一点的人,而且需要花一些时间来弄清楚你能做什么和不做什么。

AV Foundation允许您使用AVAssetReader对H.264视频进行硬件加速解码,此时您将以BGRA格式传送原始解码的视频帧。这些可以使用glTexImage2D()或iOS 5.0中更高效的纹理缓存上传到纹理。从那里,您可以处理显示或从OpenGL ES检索帧,并使用AVAssetWriter对结果执行硬件加速的H.264编码。所有这些都使用公共API,所以在任何地方都不会出现任何会导致App Store拒绝的事情。

但是,您不必滚动自己的实现。我的BSD许可开源框架GPUImage封装了这些操作并为您处理所有这些操作。您为输入H.264影片创建GPUImageMovie实例,将滤镜附加到其上(例如叠加混合或色度键控操作),然后将这些滤镜附加到GPUImageView进行显示和/或将GPUImageMovieWriter重新编码为H.来自已处理视频的264部电影。

我目前遇到的一个问题是我不遵守视频中的时间戳进行播放,因此帧的处理速度与从电影中解码的速度一样快。对于视频的过滤和重新编码,这不是问题,因为时间戳传递到记录器,但是为了直接显示到屏幕,这意味着视频可以加速2-4倍。我欢迎任何可以让您将播放速率与实际视频时间戳同步的贡献。

目前我可以在iPhone 4和720p视频上以20-25 FPS的速度播放,过滤和重新编码640x480视频,速度超过30 FPS,iPhone 4S能够以更高的1080p过滤和编码超过30 FPS。一些较昂贵的过滤器可能会对GPU造成负担并使其减慢一些,但大多数过滤器都在这些帧速率范围内运行。

如果需要,可以检查GPUImageMovie类,看看它如何上传到OpenGL ES,但相关代码如下:

- (void)startProcessing;
{
    NSDictionary *inputOptions = [NSDictionary dictionaryWithObject:[NSNumber numberWithBool:YES] forKey:AVURLAssetPreferPreciseDurationAndTimingKey];
    AVURLAsset *inputAsset = [[AVURLAsset alloc] initWithURL:self.url options:inputOptions];

    [inputAsset loadValuesAsynchronouslyForKeys:[NSArray arrayWithObject:@"tracks"] completionHandler: ^{
        NSError *error = nil;
        AVKeyValueStatus tracksStatus = [inputAsset statusOfValueForKey:@"tracks" error:&error];
        if (!tracksStatus == AVKeyValueStatusLoaded) 
        {
            return;
        }
        reader = [AVAssetReader assetReaderWithAsset:inputAsset error:&error];

        NSMutableDictionary *outputSettings = [NSMutableDictionary dictionary];
        [outputSettings setObject: [NSNumber numberWithInt:kCVPixelFormatType_32BGRA]  forKey: (NSString*)kCVPixelBufferPixelFormatTypeKey];
        // Maybe set alwaysCopiesSampleData to NO on iOS 5.0 for faster video decoding
        AVAssetReaderTrackOutput *readerVideoTrackOutput = [AVAssetReaderTrackOutput assetReaderTrackOutputWithTrack:[[inputAsset tracksWithMediaType:AVMediaTypeVideo] objectAtIndex:0] outputSettings:outputSettings];
        [reader addOutput:readerVideoTrackOutput];

        NSArray *audioTracks = [inputAsset tracksWithMediaType:AVMediaTypeAudio];
        BOOL shouldRecordAudioTrack = (([audioTracks count] > 0) && (self.audioEncodingTarget != nil) );
        AVAssetReaderTrackOutput *readerAudioTrackOutput = nil;

        if (shouldRecordAudioTrack)
        {            
            audioEncodingIsFinished = NO;

            // This might need to be extended to handle movies with more than one audio track
            AVAssetTrack* audioTrack = [audioTracks objectAtIndex:0];
            readerAudioTrackOutput = [AVAssetReaderTrackOutput assetReaderTrackOutputWithTrack:audioTrack outputSettings:nil];
            [reader addOutput:readerAudioTrackOutput];
        }

        if ([reader startReading] == NO) 
        {
            NSLog(@"Error reading from file at URL: %@", self.url);
            return;
        }

        if (synchronizedMovieWriter != nil)
        {
            __unsafe_unretained GPUImageMovie *weakSelf = self;

            [synchronizedMovieWriter setVideoInputReadyCallback:^{
                [weakSelf readNextVideoFrameFromOutput:readerVideoTrackOutput];
            }];

            [synchronizedMovieWriter setAudioInputReadyCallback:^{
                [weakSelf readNextAudioSampleFromOutput:readerAudioTrackOutput];
            }];

            [synchronizedMovieWriter enableSynchronizationCallbacks];
        }
        else
        {
            while (reader.status == AVAssetReaderStatusReading) 
            {
                [self readNextVideoFrameFromOutput:readerVideoTrackOutput];

                if ( (shouldRecordAudioTrack) && (!audioEncodingIsFinished) )
                {
                    [self readNextAudioSampleFromOutput:readerAudioTrackOutput];
                }

            }            

            if (reader.status == AVAssetWriterStatusCompleted) {
                [self endProcessing];
            }
        }
    }];
}

- (void)readNextVideoFrameFromOutput:(AVAssetReaderTrackOutput *)readerVideoTrackOutput;
{
    if (reader.status == AVAssetReaderStatusReading)
    {
        CMSampleBufferRef sampleBufferRef = [readerVideoTrackOutput copyNextSampleBuffer];
        if (sampleBufferRef) 
        {
            runOnMainQueueWithoutDeadlocking(^{
                [self processMovieFrame:sampleBufferRef]; 
            });

            CMSampleBufferInvalidate(sampleBufferRef);
            CFRelease(sampleBufferRef);
        }
        else
        {
            videoEncodingIsFinished = YES;
            [self endProcessing];
        }
    }
    else if (synchronizedMovieWriter != nil)
    {
        if (reader.status == AVAssetWriterStatusCompleted) 
        {
            [self endProcessing];
        }
    }
}

- (void)processMovieFrame:(CMSampleBufferRef)movieSampleBuffer; 
{
    CMTime currentSampleTime = CMSampleBufferGetOutputPresentationTimeStamp(movieSampleBuffer);
    CVImageBufferRef movieFrame = CMSampleBufferGetImageBuffer(movieSampleBuffer);

    int bufferHeight = CVPixelBufferGetHeight(movieFrame);
    int bufferWidth = CVPixelBufferGetWidth(movieFrame);

    CFAbsoluteTime startTime = CFAbsoluteTimeGetCurrent();

    if ([GPUImageOpenGLESContext supportsFastTextureUpload])
    {
        CVPixelBufferLockBaseAddress(movieFrame, 0);

        [GPUImageOpenGLESContext useImageProcessingContext];
        CVOpenGLESTextureRef texture = NULL;
        CVReturn err = CVOpenGLESTextureCacheCreateTextureFromImage(kCFAllocatorDefault, coreVideoTextureCache, movieFrame, NULL, GL_TEXTURE_2D, GL_RGBA, bufferWidth, bufferHeight, GL_BGRA, GL_UNSIGNED_BYTE, 0, &texture);

        if (!texture || err) {
            NSLog(@"Movie CVOpenGLESTextureCacheCreateTextureFromImage failed (error: %d)", err);  
            return;
        }

        outputTexture = CVOpenGLESTextureGetName(texture);
        //        glBindTexture(CVOpenGLESTextureGetTarget(texture), outputTexture);
        glBindTexture(GL_TEXTURE_2D, outputTexture);
        glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_LINEAR);
        glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MAG_FILTER, GL_LINEAR);
        glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_WRAP_S, GL_CLAMP_TO_EDGE);
        glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_WRAP_T, GL_CLAMP_TO_EDGE);

        for (id<GPUImageInput> currentTarget in targets)
        {            
            NSInteger indexOfObject = [targets indexOfObject:currentTarget];
            NSInteger targetTextureIndex = [[targetTextureIndices objectAtIndex:indexOfObject] integerValue];

            [currentTarget setInputSize:CGSizeMake(bufferWidth, bufferHeight) atIndex:targetTextureIndex];
            [currentTarget setInputTexture:outputTexture atIndex:targetTextureIndex];

            [currentTarget newFrameReadyAtTime:currentSampleTime];
        }

        CVPixelBufferUnlockBaseAddress(movieFrame, 0);

        // Flush the CVOpenGLESTexture cache and release the texture
        CVOpenGLESTextureCacheFlush(coreVideoTextureCache, 0);
        CFRelease(texture);
        outputTexture = 0;        
    }
    else
    {
        // Upload to texture
        CVPixelBufferLockBaseAddress(movieFrame, 0);

        glBindTexture(GL_TEXTURE_2D, outputTexture);
        // Using BGRA extension to pull in video frame data directly
        glTexImage2D(GL_TEXTURE_2D, 0, GL_RGBA, bufferWidth, bufferHeight, 0, GL_BGRA, GL_UNSIGNED_BYTE, CVPixelBufferGetBaseAddress(movieFrame));

        CGSize currentSize = CGSizeMake(bufferWidth, bufferHeight);
        for (id<GPUImageInput> currentTarget in targets)
        {
            NSInteger indexOfObject = [targets indexOfObject:currentTarget];
            NSInteger targetTextureIndex = [[targetTextureIndices objectAtIndex:indexOfObject] integerValue];

            [currentTarget setInputSize:currentSize atIndex:targetTextureIndex];
            [currentTarget newFrameReadyAtTime:currentSampleTime];
        }
        CVPixelBufferUnlockBaseAddress(movieFrame, 0);
    }

    if (_runBenchmark)
    {
        CFAbsoluteTime currentFrameTime = (CFAbsoluteTimeGetCurrent() - startTime);
        NSLog(@"Current frame time : %f ms", 1000.0 * currentFrameTime);
    }
}