让AI本身调整超参数,谷歌大脑新优化器火了,自适应差别使命,83个使命训练加速比典范Adam更快

2年前 (2022-11-25)阅读2回复1
小小的人啊
小小的人啊
  • 管理员
  • 注册排名4
  • 经验值472270
  • 级别管理员
  • 主题94454
  • 回复0
楼主

萧箫 发自 凹非寺

量子位 | 公家号 QbitAI

还在苦恼怎么给 优化器调整更好的参数吗?

如今,谷歌大脑搞出了一个新的优化器VeLO,无需手动调整任何超参数,间接用就完事了。

与其别人工设想的如Adam、AdaGrad等算法差别,VeLO完全基于AI构造,可以很好地适应各类差别的使命。

当然,效果也更好。论文做者之一Lucas Beyer将VeLO与其他“重度”调参的优化器停止了比照,性能八两半斤:

有网友看到了一丝优化器朝上进步的曙光:

在Adam之后呈现了很多优化器,却都表示得十分失败。那个优化器或许确实能表示更好。

展开全文

在Adam之后呈现了很多优化器,却都表示得十分失败。那个优化器或许确实能表示更好。

所以,那个基于AI的优化器是若何打造的?

VeLO事实是怎么打造的?

在训练神经收集的过程中,优化器 (optimizer)是必不成少的一部门。

△神经收集训练过程,图源Thomas Wolf

但AI模子应用都那么普遍了,训练AI模子用的优化器却仍然是人工设想的,听起来几有点不合理。

于是谷歌大脑的研究人员灵机一动:为何不消AI来做一个优化器呢?

设想上,优化器的原理基于 元进修的构想,即从相关使命上进修经历,来搀扶帮助进修目的使命。

比拟迁徙进修,元进修更强调获取元常识,它是一类使命上的通用常识,能够被泛化到更多使命上去。

基于那一思惟,VeLO也会吸收梯度并主动输出参数更新,无需任何超参数调优,并自适应需要优化的各类使命。

架构上,AI优化器整体由LSTM (长短期记忆收集)和超收集MLP (多层感知机)构成。

此中每个LSTM负责设置多个MLP的参数,各个LSTM之间则通过全局上下文信息停止彼此协做。

训练上,AI优化器接纳元训练的体例,以参数值和梯度做为输入,输出需要更新的参数。

颠末4000个TPU月 (一块TPU运行4000个月的计算量)的训练,集各类优化使命之所长后,VeLO末于横空出生避世。

比人工调参优化器效果更好

成果表白,VeLO在83个使命上的加速效果超越了一系列当前已有的优化器。

此中y轴是比拟Adam加速的倍率,x轴是使命的比例。

成果显示,VeLO不只比无需调整超参数的优化器效果更好,以至比认真调整过超参数的一些优化器效果还好:

与“典范老迈哥”Adam比拟,VeLO在所有使命上训练加速都更快,此中50%以上的使命比调整进修率的Adam快4倍以上,14%以上的使命中,VeLO进修率以至快上16倍。

而在6类进修使命 (数据集+对应模子)的优化效果上,VeLO在此中5类使命上表示效果都与Adam相当以至更好:

值得一提的是,此次VeLO也被摆设在 JAX中,看来谷歌是实的很鼎力推广那个新框架了。

巴特,也有网友认为消耗4000个TPU月来训练VeLO,计算量成本过大:

固然那个停顿很重要,但它以至都快赶上GPT-3的训练量了。

固然那个停顿很重要,但它以至都快赶上GPT-3的训练量了。

目前VeLO已经开源,感兴趣的小伙伴们能够去尝尝那个新的AI优化器。

One More Thing

前段时间,一位哈佛博士生提了个有意思的设法,得到很多人附和:

更多论文的做者们也应该像演人员表一样,公开本身在论文中的工做内容。

更多论文的做者们也应该像演人员表一样,公开本身在论文中的工做内容。

Kareem Carr是生物统计学范畴的博士生,做者奉献在生物论文中比力常见,不外之前在AI论文中见得不多。

如今,那篇谷歌大脑论文的做者们也如许做了,谁写的论文、谁搭建的框架一目了然:

不晓得以后会不会成为机器进修圈的新风气 (手动狗头)。

GitHub地址:

论文地址:

— 完—

MEET 2023 大会定档!

首批嘉宾阵容公布

量子位「MEET2023智能将来大会」正式定档12月14日!

首批嘉宾包罗 郑纬民院士、MSRA 刘铁岩、阿里 贾扬清、百度 段润尧、高通 Ziad Asghar、小冰 李笛、海潮 刘军以及中关村科金 张杰等来自产学研界大咖嘉宾,更多重磅嘉宾陆续确认中。

点击 “预约”按钮,一键中转大会曲播现场!

点那里存眷我 👇 记得标星噢 ~

一键三连「分享」、「点赞」和「在看」

科技前沿停顿日日相见 ~

0
回帖

让AI本身调整超参数,谷歌大脑新优化器火了,自适应差别使命,83个使命训练加速比典范Adam更快 相关回复(1)

月影婆娑
月影婆娑
沙发
AI超参自动调优,谷歌新优化器引领风潮;自适应任务加速显著超越Adam。
传说2个月前 (05-31 10:20)回复00
取消
载入表情清单……
载入颜色清单……
插入网络图片

取消确定

图片上传中
编辑器信息
提示信息