应用错误收集

计算机视觉，项目创意？

时间：2010-06-20 17:04:53

标签： computer-vision

我是一名本科生，也是这个课程的最后一年。在任何计算学位，我必须做一个项目（个人）关于任何将在计算机上的主题。我想要的东西将在计算机视觉下（对象检测或跟踪准确）。搜索有关该主题的信息我发现已经有这么多人完成了这些类型的项目。我的问题是，如果我要做一个项目，如跟踪视频中的对象我是否必须提出我自己的算法，或者是否有任何算法可用对我来说编码。（我熟悉java并开始有点python）

请指导我选择一个主题以及如何开始或从何处开始的小想法

5 个答案:

答案 0 :(得分：6)

我在毕业研究期间完成了计算机视觉的基础课程，我们所做的第一个项目之一是实现一个系统，将一系列图像拼接成无缝的360度全景。

涉及：

检测单个图像中的区分特征（使用SIFT特征提取），
其他图片中最佳匹配功能（功能匹配），
自动对齐图片（单应性估计），
确定它们的重叠和相机的相对位置（相机姿态估计），
将图像投影到圆柱坐标系（图像变形），
然后，最后，将生成的照片混合成一个无缝的全景图像（图像混合）。

这个项目面临的挑战是使代码足够高效，以便快速进行图像拼接。

您可以在互联网上找到很多资源来帮助您完成项目。

答案 1 :(得分：3)

如果您想做一些非常酷且有趣的事情，请尝试在视频中开发活动检测算法。例如，“男人离开汽车”，“人们进入建筑物”等。对于UG论文而言，这不是一项微不足道的任务和挑战。您可以使用OpenCV等工具包在视频处理和对象检测等方面进行基础工作，同时专注于算法。

答案 2 :(得分：1)

现有许多计算机视觉和图像分析算法。几年前我在研究生院上了一堂课，这很有意思，所以我建议你通过大学图书馆或书店查看有关这个主题的文字，以便很好地掌握可用的内容。

这项技术有真实的应用。光学字符识别（OCR）是一个在很大程度上引起了一些高调应用的领域。

你选了一个有趣的话题，玩得开心！：）

答案 3 :(得分：0)

python和openCV的起点：

http://creatingwithcode.com/howto/face-detection-in-static-images-with-python

答案 4 :(得分：0)

以下是您可能感兴趣的一些计算机视觉项目构想：

学习各种MNIST数字
图像检索的可视文字
使用非参数聚类的图像分割
使用CNN的视频分类
基于CNN和PCA嵌入的图像搜索
卡尔曼滤波器跟踪
基于超像素的视频压缩
使用神经网络的光学字符识别
视觉和语义嵌入（为图像生成标题）

为了开始深度学习项目，我推荐在Theano / TensorFlow上运行的Keras库作为后端，有许多examples。此外，您会发现OpenCV tutorials非常有用。此外，您可以在以下github页面找到上述某些项目的实现。