Question

我们遵循了this Video-OCR tutorial，并且能够从示例视频中成功提取文本。现在，我们想在原始示例视频中可视化我们的结果，有点像字幕或其他某种形式的叠加。

Azure媒体服务能够做到这一点吗？还是我们应该尝试其他SDK /其他语言？

我们要覆盖的文本在JSON中的结构如下：

{
    "start": 270000,               // starts at 3 seconds
    "duration": 315000,            // lasts 0,5 seconds
    "events": [
        {
            "region": {
                "language": "English",
                "orientation": "Up",
                "lines": [
                    {
                        "text": "TEXT DETECTED",
                        "left": 96,
                        "top": 28,
                        "width": 128,
                        "height": 23,
                        "word": [
                            {
                                "text": "TEXT",
                                "left": 96,
                                "top": 28,
                                "width": 42,
                                "height": 23,
                                "confidence": 290
                            },
                            {
                                "text": "DETECTED",
                                "left": 142,
                                "top": 28,
                                "width": 82,
                                "height": 23,
                                "confidence": 270
                            }
                        ]
                    }
                ]
            }
        }
    ]
}

我想根据这些数据是否可以在原始视频中添加文字叠加层，创建带有标记的输出视频，以可视化我们的结果。做这样的事情：

（但在本地，而不是在youtube上托管）

如何使用C＃在视频中添加文字叠加层？

0 个答案: