最自然的学习规则是使用任何在过去回合中损失最小的向量。 这与Consistent算法的精神相同,它在在线凸优化中通常被称为Follow-The-Leader,最小化累积损失。

  对于任何t:

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

         在线学习和在线凸优化(online learning and online convex optimization)—FTL算法5 人工智能 第1张  

  在线学习和在线凸优化(online learning and online convex optimization)—FTL算法5 人工智能 第2张

  我们谈到了能最小化累计损失不能说明此算法在在线学习场景是有效,我们需要探究算法的 Regret bound:

  在线学习和在线凸优化(online learning and online convex optimization)—FTL算法5 人工智能 第3张

  采用归纳法证明:

  在线学习和在线凸优化(online learning and online convex optimization)—FTL算法5 人工智能 第4张

  例子1:Online Quadratic Optimization

  在线学习和在线凸优化(online learning and online convex optimization)—FTL算法5 人工智能 第5张

  例子2:Online Linear Optimization

  在线学习和在线凸优化(online learning and online convex optimization)—FTL算法5 人工智能 第6张

  未完,待续。。。。。。

  下一节将讲述FTRL算法

 

  

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄