我们遵循了this Video-OCR tutorial,并且能够从示例视频中成功提取文本。现在,我们想在原始示例视频中可视化我们的结果,有点像字幕或其他某种形式的叠加。
Azure媒体服务能够做到这一点吗?还是我们应该尝试其他SDK /其他语言?
我们要覆盖的文本在JSON中的结构如下:
{
"start": 270000, // starts at 3 seconds
"duration": 315000, // lasts 0,5 seconds
"events": [
{
"region": {
"language": "English",
"orientation": "Up",
"lines": [
{
"text": "TEXT DETECTED",
"left": 96,
"top": 28,
"width": 128,
"height": 23,
"word": [
{
"text": "TEXT",
"left": 96,
"top": 28,
"width": 42,
"height": 23,
"confidence": 290
},
{
"text": "DETECTED",
"left": 142,
"top": 28,
"width": 82,
"height": 23,
"confidence": 270
}
]
}
]
}
}
]
}
我想根据这些数据是否可以在原始视频中添加文字叠加层,创建带有标记的输出视频,以可视化我们的结果。 做这样的事情: