我正在使用linux上的dlib进行字符识别。当我训练我的网络1000个字符时,网络会收敛,直到达到100%的准确度,但是当我尝试用10,000或100,000个字符进行训练时,它不会再收敛到100%的准确度。我的学习率仍在下降,但错误预测的数量并没有改变。我使用的网络如下
using net_type = loss_multiclass_log<
dlib::fc<nbClassConst,
dlib::relu<dlib::fc<120,
dlib::relu<dlib::fc<400,
dlib::max_pool<2, 2, 2, 2, dlib::relu<con<16, 5, 5, 1, 1,
dlib::max_pool<2, 2, 2, 2, dlib::relu<con<6, 5, 5, 1, 1,
dlib::input<matrix<unsigned char>>
>>>>>>>>>>>>;
它基于dlib的dnn_introduction2_ex.cpp示例。我不知道是否必须使用网络的某些参数,或者我是否不适合我想要做的事情。我将不胜感激任何建议或帮助。