1. Learning rate不合适,如果太大,会造成不收敛,如果太小,会造成收敛速度非常慢;

2. Batch size太大,陷入到局部最优;

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

3. 网络太简单,一般情况下,网络的层数和节点数量越大,拟合能力就越强,如果层数和节点不够多,无法拟合复杂的数据,也会造成不收敛.

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄