我是Tensorflow对象检测的新手。
我想知道如果我有有限的数据(图像,例如:一本书的一纸),如何训练模型来检测书籍的一部分(有时是文本,有时是图像)?
我尝试过用1张纸进行训练,但损失永远不会低于1。
请帮助我。
答案 0 :(得分:1)
要训练模型来检测本书的一部分(例如横幅/标题),您应该制作一个视频,使用ffmpeg提取图像并将其输入网络。另外,您应该学习ML的一些基础课程。训练模型时,数据集通常应为10k +。输入越少,输出越差。得到没有。所需的图像,我建议您选择ffmpeg .....
答案 1 :(得分:1)
最好的方法是扩充数据,这将增加用于训练模型的不同图像的数量。
有关不同的图像转换技术,请参考 openCV 和 scikit-image :
仿射变换
透视变换