数据缩至1/5000，模型准确率却翻倍，谷歌新“蒸馏法”火了

中华商机在线网 › 网站首页 › 资讯列表› 资讯内容

数据缩至1/5000，模型准确率却翻倍，谷歌新“蒸馏法”火了

2022-01-01 发布于中华商机在线网

搜视频免费在线看最新电视剧 https://www.soosp.net

博雯发自凹非寺量子位报道|公众号QbitAI

在炼丹过程中，为了减少训练所需资源，MLer有时会将大型复杂的大模型“蒸馏”为较小的模型，同时还要保证与压缩前相当的结果。

这就是知识蒸馏，一种模型压缩/训练方法。

不过随着技术发展，大家也逐渐将蒸馏的对象扩展到了数据集上。

这不，谷歌最近就提出了两种新的数据集蒸馏方法，在推特上引起了不小反响，热度超过600：

像这样，将50000张标注图像的CIFAR-10数据集“蒸馏”缩小至1/5000大小，只基于10张合成数据点进行训练，模型的准确率仍可近似51%：

△上：原始数据集下：蒸馏后

而如果“蒸馏数据集”由500张图像组成（占原数据集1%大小），其准确率可以达到80%。

两种数据集蒸馏方法分别来自于ICLR2021和NeurIPS2021上的两篇论文。

通过两阶段循环进行优化

那么要如何才能“蒸馏”一个数据集呢？

其实，这相当于一个两阶段的优化过程：

“内部循环”，用于在学习数据上训练模型“外部循环”，用于优化学习数据在自然数据上的性能

通过内部循环可以得到一个核岭回归（KRR）函数，然后在外部循环中计算原始图像标注与核岭回归函数预测标注之间的均方误差（MSE）。

这时，谷歌提出的两种方法就分别有了不同的处理路线：

一、标注解释（LS）

这种方法直接解释最小化KRR损失函数的支持标注集（supportlabels），并为每个支持图像生成一个独特的密集标注向量。

△蓝：原始独热标注橙：LS生成的密集标注

二、核归纳点（KIP）

这种方法通过基于梯度的方法将KRR损失函数最小化，以此来优化图像和可能生成的数据。

以MNIST为例，下图中的上、中、下三张图分别为原始的MNIST数据集、固定标注的KIP蒸馏图像、优化标注的KIP蒸馏图像。

可以看出，在于对数据集进行蒸馏时，优化标注的效果最好：

对比已有的DC（DatasetCondensation）方法和DSP（DatasetCondensationwithDifferentiableSiameseAugmentation）方法可以看到：

如果使用每类别只有一张图像，也就是最后只有10张图像的蒸馏数据集，KIP方法的测试集准确率整体高于DC和DSP方法。

在CIFAR-10分类任务中，LS也优于先前的方法，KIP甚至可以达到翻倍的效果。

对此，谷歌表示：

这证明了在某些情况下，我们的缩小100倍的“蒸馏数据集”要比原始数据集更好。

两位华人作者

整个项目由萧乐超（LechaoXiao）、ZhourongChen、RomanNovak三人合作完成。

其中萧乐超为LS方法的论文作者之一，本科毕业于浙江大学的应用数学系，在美国伊利诺大学厄巴纳-香槟分校（UIUC）取得博士学位，现在是谷歌大脑团队的一名科学家。

他的主要研究方向是数学、机器学习和深度学习。

另一位华人科学家ZhourongChen则是KIP方法的论文作者之一，本科毕业于中山大学，并在香港科技大学取得了计算机科学与工程系的博士学位，现是GoogleResearch的一名软件工程师。

论文：[1]https://openreview.net/forum?id=l-PrrQrK0QR[2]https://openreview.net/forum?id=hXWPpJedrVP

开源地址：https://github.com/google-research/google-research/tree/master/kip

参考链接：https://ai.googleblog.com/2021/12/training-machine-learning-models-more.html

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

中华商机在线网

亲爱的游客，欢迎！

客服电话

电子邮件

数据缩至1/5000，模型准确率却翻倍，谷歌新“蒸馏法”火了

请发表评论

全部评论

相关阅读

中华商机在线网

任务跟踪流程可视化

深入了解OA流程挖掘：提升企业效率的新兴技术

心理咨询室设备厂家-可心心理

探索流程挖掘的平台有哪些

西井科技携创新方案登陆 TOC Europe 2025，以 AI 与绿色科技重构智慧物流生态

探寻视听新境界：高清影院带来的沉浸式观影体验

3790影院：免费在线看最热电影的理想选择

免费电影网：畅享无限影视盛宴的门户

福利在线：让生活更美好

高清电影网：让观影体验更上一层楼

搜视频在线看最热影视的乐趣与便捷

热门课程

新手指南

关于我们

帮助中心