我看着Yahoo的旧NSFW检测器,不禁怀疑是否有一个Yolo DNN
版本针对类似(未发布)的数据集进行了训练,可以检测并定位图片上的人体裸露?>
至少有一个公共数据库吗?还是我必须自己收集一个数据库?
答案 0 :(得分:3)
最近已共同努力为此类数据实施刮板。如this article中所述,它产生了220k的图像数据集,您可以在this repo's /raw_data
folder中找到它。
它可能已经对您有用,但是该数据集具有非常通用且稀疏定义的类别,这启发了newer, better organized dataset。它具有159个定义的类别,总共有 158万个imgur URL 。这些主要来自Reddit渠道,在Reddit的所有分类荣耀中,这些渠道都有助于标签的整体布局。仓库的README
声称在清理数据后-例如重复/损坏/删除的数据删除-您的总容量应具有约500 GB和约130万张图像。
对于经过预训练的YOLO,没有经过精打细算的工作。如果您对将内容过滤委派给Google的Cloud Vision API的依赖性和成本感到满意,他们会claim to be good at classifying visual adult content。否则,由于大多数性质相同的作品似乎都是私人的,所以您必须自己训练。