我正在寻找一种程序化视频编辑解决方案,该解决方案可以提供API,用于在视频(1080p)剪辑的特定坐标上的特定时间/帧中添加图像和文本叠加,以及调整大小到720p等。
我试过AviSynth,但由于“内存不足错误”导致总共约400次覆盖后被阻止 - 请参阅AviSynth Out of Memory Error (100s of image overlays)
还有什么我可以尝试的(示例代码会很棒)?
答案 0 :(得分:5)
您可以随时使用我推荐的商业解决方案,例如Adobe After Effects,它具有您可以使用JavaScript(jsx
文件)控制的API。
商业视频和合成解决方案通常比免费/开源替代方案更强大且具有更好的缓存和缓冲功能,这意味着它们可以在不耗尽内存的情况下为组合添加更多层。
(正如旁注:我指的是After Effects here事件虽然它是面向构图的.Adobe Premier(或其他非线性编辑器)对于简单的图像和文本叠加来说是更自然的选择,但它确实如此没有脚本界面(AFAIK并没有为Adobe网站列出这些资源)。但是,也可以用AE创建长序列,你可以使用添加到场景中的元素做更多的事情。)
如果您已熟悉JavaScript,那么(显然)只是阅读API文档中的对象,方法和属性等等(我添加了以下文档的链接)。
Adobe也有自己的JavaScript编辑器(但不是必需的)可以在以下位置找到:
Mac OS X:
/Applications/Utilities/Adobe Utilities CS6/ExtendScript Toolkit CS6/
视窗:
C:\Program Files\Adobe\Adobe Utilities - CS6\ExtendScript Toolkit CS6
以下来自this site的示例创建了一个comp,然后向其添加了一个文本图层(转到网站以获取完整脚本):
// create project if necessary
var proj = app.project;
if(!proj) proj = app.newProject();
// create new comp named 'my text comp'
var compW = 160; // comp width
var compH = 120; // comp height
var compL = 15; // comp length (seconds)
var compRate = 24; // comp frame rate
var compBG = [48/255,63/255,84/255] // comp background color
var myItemCollection = app.project.items;
var myComp = myItemCollection.addComp('my text',compW,compH,1,compL,compRate);
myComp.bgColor = compBG;
然后添加文本图层:
var text;
while (!myFile.eof){
text = myFile.readln();
if (text == "") text = "\r" ;
myComp.layers.addText(text);
}
您还可以使用JavaScript / jsx文件控制Photoshop / Illustrator,这样您就可以制作强大的组合/效果等(这让我想起了旧的AREXX :-))。
使用Python的解决方案有类似的API,例如Flame(以及在Auto-desk购买后不再可用的Combustion),但这里的价格范围相对较高。
如果商业变体不是一个选项,那么您可以查看Blender,它也为Python提供API。
但请注意,Blender主要面向3D,但也可用于视频合成。
从this page获取的示例会将文字写入屏幕:
def write():
"""write on screen"""
width = render.getWindowWidth()
height = render.getWindowHeight()
# OpenGL setup
bgl.glMatrixMode(bgl.GL_PROJECTION)
bgl.glLoadIdentity()
bgl.gluOrtho2D(0, width, 0, height)
bgl.glMatrixMode(bgl.GL_MODELVIEW)
bgl.glLoadIdentity()
# BLF drawing routine
font_id = logic.font_id
blf.position(font_id, (width * 0.2), (height * 0.3), 0)
blf.size(font_id, 50, 72)
blf.draw(font_id, "Hello World")
当然,您可以随时编写FFmpeg等程序,这本身就非常强大和灵活。
您可以通过在命令行添加参数来编写脚本,例如(taken from here):
在视频帧的最后一行显示从右向左滑动的文本行。假设文件'LONG_LINE'包含一行,没有换行符。
drawtext="fontsize=15:fontfile=FreeSerif.ttf:text=LONG_LINE:y=h-line_h:x=-50*t"
您只需将其放入某种批处理文件中并运行即可。当然,这些限制是您需要进行一些反复试验才能使文本和图像准确显示在您希望的位置。
我从未尝试过数百个图层,我怀疑它有内置的缓冲区/缓存来处理大量的图层,但它值得一试,因为它既自由又强大。