我被要求写一个程序
a。识别特定物体
b。在图片上找到它(确定是在图片的前1/3,后1/3还是后1/3-左,中或右)
c。计算项目在每个部门花费的时间-给我700张照片,每张每秒拍摄一次。
我从读取数据开始:
for filename in os.listdir('.'):
if filename.endswith('.jpeg'):
im = Image.open(filename)
width, height = im.size
我知道这有点过度,但是我实际上不知道如何解决这个问题-这里的主要问题似乎是检测到该项目-我应该为此使用转移学习吗?有没有更简单的选择?
答案 0 :(得分:0)
Hough transform是在图像中查找几何形状的一种非常标准的方法。 Generalised Hough transform对此进行了修改,以在图像中找到任意形状。
OpenCV有一些Hough变换,但不是广义的;但是,someone's asked about this before。
希望这会为您指明正确的方向。
答案 1 :(得分:0)
如果可以告诉您要尝试检测的对象类型,这将很有帮助。有多个预训练的模型可以检测多个对象(请注意,这属于深度学习类别,根据问题的不同,可能会采用相对较容易的方法)。这是TensorFlow库及其预训练模型的链接
这是COCO数据集可以检测到的对象列表,
https://github.com/nightrome/cocostuff/blob/master/labels.txt
这只是一个数据集的示例。您将必须做自己的研究才能实施该模型。互联网上有大量指南。这是Tensorflow本身的官方指南,
https://github.com/tensorflow/models/tree/master/research/object_detection
祝你好运。希望这对您有帮助!