有没有将2D视频转换为3D视频的算法?

时间:2010-01-28 10:23:32

标签: algorithm video 3d 2d translation

是否有将2D视频转换为3D视频(使用眼镜观看)的算法?

(A-la将“阿凡达”变为“阿凡达”以获得IMAX 3D体验。)或至少将其转换为准备好使用它进行3D观看的视频a-la:

Alt text http://www.3dglassesonline.com/how-do-3d-glasses-work/3-d-glasses-traditional.gif

Alt text http://www.3dglassesonline.com/how-do-3d-glasses-work/3-d-glasses-polarization-new.gif

10 个答案:

答案 0 :(得分:14)

好吧,斯坦福确实有an algorithm for converting 2D photos into 3D models。我的猜测是,电影应该更容易,因为那时你有几张照片而不是一张,所以你可以通过比较相邻的帧来提取更多关于深度的信息。

可以说,结果永远不会像你刚开始以3D渲染/拍摄电影一样好。

答案 1 :(得分:4)

否 - 3D视频要求提供额外信息(深度),而这些信息(深度)根本不包含在2D视频中。

如果您有一个场景的2D渲染(例如在玩具总动员中),那么很容易制作3D电影 - 您只需更改场景的视角并重新渲染。

答案 2 :(得分:4)

一般情况下,它不能起作用的原因很简单:假设你有一个墙上有一个窗口的场景显示一个海滩,除此之外,你有一张照片显示一个墙上的窗户显示一个海滩。算法如何区分这两者?你如何通过深度检测现实是什么?什么只是平面照片?

答案 3 :(得分:3)

不是真的。算法应该以某种方式理解场景内容并从中推断出深度信息吗?请记住,3D视频需要深度信息。否则,无法知道偏移两个框架部分的程度。

你可以尝试通过为不同程度的焦点分配各种深度来尝试它,但我怀疑可以使用的东西会出现。

答案 4 :(得分:3)

每个人都没有单独的算法,但是,有可能。这很难。有人正在解决这个问题。所涉及的算法编写起来非常具有挑战性,它们并不总是正常工作,任何完整的解决方案都需要大量的处理能力。任何解决方案最初都会脱机(而不是实时)。

3D感知与您可能认为的立体光学并不紧密相关。如果您认为需要两只眼睛才能看到3D,那么请尝试使用眼罩四处走动。你会做的很好。有一些(小)程序,包括一些商业软件包,可以从没有立体相机的2D图像集创建3D模型。有些人在线运行,构建更详细的模型,因为可以看到更多。

考虑到这一点,我可以想到你特别遇到电影遇到的一些问题。例如,我可以想象在不正确的深度渲染的遮罩。具有Apple Motion等软件特效的视频最终可能会出现奇怪的文物。

答案 5 :(得分:2)

在今年的CES节目中,Toshiba展示了电视电视节目,他们声称能够将2D电视信号转换为3D。我不知道它是否产生了良好的结果或者它们正在使用什么算法,但如果它们是真的,那么应该有一个算法。

但不幸的是,我不知道怎么做。

答案 6 :(得分:2)

现有算法用于从2D图像中提取3D形状,例如herehere。您可以从每个视频帧中提取形状,甚至可以使用多个帧通过检测其运动来更好地理解形状。

然而,可能的结果是,结果将远远不及3D电影的标准内容质量。

答案 7 :(得分:2)

在我曾经工作过的地方进行了一些研究(尽管我根本没有参与其中)。本文 Automatic extraction of 3D models from an airborne video sequence 可能会有所帮助。

答案 8 :(得分:2)

也许会有一种模拟立体视图的算法,但它不能相同。

原因很简单。在2D视频中,不仅缺少深度信息(这不足以获得立体视频),而且缺少从另一个视角可见的隐藏表面。

每个人都可以认为深度信息可以从可用信息中推断出来,这是事实。但是,缺失的信息对于获得良好的立体效果不是那么准确。

除此之外,我听说过一个系统可以从指向同一目标的8个(8个)摄像机中提取准确的3D模型。正确模仿衣服运动是如此准确。然而,这是处理8(八个!)2D视频。如何只用一个2D视频就可以达到相同的效果?

所需结果的实现主要取决于信息的可用性,在这种情况下(恕我直言),没有信息。尽管如此,有可能尝试从2D视频模拟立体效果,但基本上它需要艰苦的工作,长时间的处理,结果是低质量的结果,尊重原始的立体视频。


我想记住3D视图是由我们的大脑生成的。眼睛只能拍摄2D图像,处理这两个图像的大脑可以生成所见物体的深度视图。

答案 9 :(得分:1)

您应该了解偏光眼镜和红/蓝眼镜之间的区别。红/蓝眼镜3D效果很简单。你只需要拍摄一张相距几英寸的照片(有点像是如何布置眼睛)并将每个图像叠加在另一个上。有关如何在 Making Anaglyph Images in Adobe Photoshop 中执行此操作的教程。

对于偏振眼镜的效果,这有点难。如果你去电影院观看带偏光眼镜的3D电影,你会看到真正的3D。它的工作原理是拥有两台投影机。一台投影机以一种偏振方式投影电影,第二台投影机以另一种偏振方式投影电影。图像叠加在一起,所以如果你戴着3D偏光眼镜,它会以3D形式出现。

使用电视或电脑显示器无法轻松完成此操作。您的电视或显示器必须同时投影两张图像。由于现在3D的普及,市场上出现的3D电视和显示器不会投影两个图像,而是显示3D。以下是它们的工作原理:

普通电脑屏幕或电视以60 Hz的频率刷新。这意味着每秒60次,您看到的图像正在刷新。因为这是如此之快,人眼看不到闪烁。 3D电视和显示器以120 Hz的频率刷新。偏振图像的交换速度为每秒120次,但由于有两种,它每秒出现60次,这就是产生3D效果的原因。

我希望这可以帮助你理解一点。

要回答您的问题,是的,您可以创建3D视频,但您需要3D显示器和3D电视才能观看。