我在https://github.com/BVLC/caffe/tree/master/models/bvlc_googlenet检测和本地化过程中使用了GoogleNet的Caffe实现。我使用这个网络在我自己的细粒度分类任务上进行转移学习取得了巨大的成功,但是我使用开箱即用的实现时间要困难得多。使用稍微调整后的deploy.prototxt版本,批量大小从10减少到1,我预测图像的类contained in this directory。
{
'bikini1': {
'445': 0.44777653,
'459': 0.42523962,
'543': 0.0014282113,
'638': 0.083084606,
'639': 0.03712019},
'bikini2': {
'445': 0.34988937,
'459': 0.56838924,
'638': 0.053508826,
'639': 0.0262988,
'775': 0.00064279145},
'cheeseburger1': {
'923': 0.00077056035,
'924': 0.00074912253,
'931': 0.0040806201,
'933': 0.98862922,
'964': 0.0012325585},
'cheeseburger2': {
'923': 5.947132e-05,
'928': 0.00013152717,
'931': 0.00084521802,
'933': 0.99827468,
'934': 0.00013743658},
'ipod1': {
'487': 0.0010906343,
'605': 0.99825007,
'632': 9.7395357e-05,
'662': 0.00010778452,
'754': 0.00011993563},
'ipod2': {
'487': 1.3061179e-05,
'592': 2.9665862e-05,
'605': 0.99993002,
'681': 9.4235074e-06,
'761': 3.5998178e-06}
}
这些图像直接来自ImageNet训练集。有趣的是,网络以高度自信的方式为每对分配相同的标签,但这些标签似乎与labels provided by ImageNet完全不一致。网络似乎正在运行,但也许我引用了错误的类标签映射?任何Caffe / ImageNet专家的帮助将不胜感激!