我的账户
中华商机在线网

自媒体资讯干货

亲爱的游客,欢迎!

已有账号,请

立即登录

如尚未注册?

加入我们
  • 客服电话
    点击联系客服

    在线时间:8:00-16:00

    客服电话

    400-000-0000

    电子邮件

    xjubao@163.com
  • APP下载

    中华商机在线网APP

    随时随地掌握行业动态

  • 官方微信

    扫描二维码

    关注中华商机在线网公众号

中华商机在线网 网站首页 资讯列表 资讯内容

数据缩至1/5000,模型准确率却翻倍,谷歌新“蒸馏法”火了

2022-01-01 发布于 中华商机在线网
搜视频免费在线看最新电视剧 https://www.soosp.net

博雯发自凹非寺量子位报道|公众号QbitAI

在炼丹过程中,为了减少训练所需资源,MLer有时会将大型复杂的大模型“蒸馏”为较小的模型,同时还要保证与压缩前相当的结果。

这就是知识蒸馏,一种模型压缩/训练方法。

不过随着技术发展,大家也逐渐将蒸馏的对象扩展到了数据集上。

这不,谷歌最近就提出了两种新的数据集蒸馏方法,在推特上引起了不小反响,热度超过600:

像这样,将50000张标注图像的CIFAR-10数据集“蒸馏”缩小至1/5000大小,只基于10张合成数据点进行训练,模型的准确率仍可近似51%:

△上:原始数据集下:蒸馏后

而如果“蒸馏数据集”由500张图像组成(占原数据集1%大小),其准确率可以达到80%。

两种数据集蒸馏方法分别来自于ICLR2021和NeurIPS2021上的两篇论文。

通过两阶段循环进行优化

那么要如何才能“蒸馏”一个数据集呢?

其实,这相当于一个两阶段的优化过程:

“内部循环”,用于在学习数据上训练模型“外部循环”,用于优化学习数据在自然数据上的性能

通过内部循环可以得到一个核岭回归(KRR)函数,然后在外部循环中计算原始图像标注与核岭回归函数预测标注之间的均方误差(MSE)。

这时,谷歌提出的两种方法就分别有了不同的处理路线:

一、标注解释(LS)

这种方法直接解释最小化KRR损失函数的支持标注集(supportlabels),并为每个支持图像生成一个独特的密集标注向量。

△蓝:原始独热标注橙:LS生成的密集标注

二、核归纳点(KIP)

这种方法通过基于梯度的方法将KRR损失函数最小化,以此来优化图像和可能生成的数据。

以MNIST为例,下图中的上、中、下三张图分别为原始的MNIST数据集、固定标注的KIP蒸馏图像、优化标注的KIP蒸馏图像。

可以看出,在于对数据集进行蒸馏时,优化标注的效果最好:

对比已有的DC(DatasetCondensation)方法和DSP(DatasetCondensationwithDifferentiableSiameseAugmentation)方法可以看到:

如果使用每类别只有一张图像,也就是最后只有10张图像的蒸馏数据集,KIP方法的测试集准确率整体高于DC和DSP方法。

在CIFAR-10分类任务中,LS也优于先前的方法,KIP甚至可以达到翻倍的效果。

对此,谷歌表示:

这证明了在某些情况下,我们的缩小100倍的“蒸馏数据集”要比原始数据集更好。

两位华人作者

整个项目由萧乐超(LechaoXiao)、ZhourongChen、RomanNovak三人合作完成。

其中萧乐超为LS方法的论文作者之一,本科毕业于浙江大学的应用数学系,在美国伊利诺大学厄巴纳-香槟分校(UIUC)取得博士学位,现在是谷歌大脑团队的一名科学家。

他的主要研究方向是数学、机器学习和深度学习。

另一位华人科学家ZhourongChen则是KIP方法的论文作者之一,本科毕业于中山大学,并在香港科技大学取得了计算机科学与工程系的博士学位,现是GoogleResearch的一名软件工程师。

论文:[1]https://openreview.net/forum?id=l-PrrQrK0QR[2]https://openreview.net/forum?id=hXWPpJedrVP

开源地址:https://github.com/google-research/google-research/tree/master/kip

参考链接:https://ai.googleblog.com/2021/12/training-machine-learning-models-more.html

1

鲜花
1

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

相关阅读

  • 中华商机在线网
    1970-01-01
  • 中华商机在线网
    1970-01-01
  • 中华商机在线网
    1970-01-01
  • 中华商机在线网
    1970-01-01
  • 中华商机在线网
    1970-01-01
  • 中华商机在线网
    1970-01-01
中华商机在线网

扫一扫二维码关注我们Get最新资讯

相关分类
热点推荐
关注我们
中华商机在线网与您同行

客服电话:400-000-0000

客服邮箱:xjubao@163.com

周一至周五 9:00-18:00

中华商机在线网 版权所有

Powered by 中华商机在线网 X1.0@ 2015-2020