您当前浏览器版本过低,为了不影响您的使用,建议您使用最新的谷歌浏览器、火狐浏览器、 360浏览器,更换浏览器后使用更流畅!(注意!双核浏览器请切换为极速模式)
工信部人工智能赋能中小企业典型应用场景案例(科研领域)

缩小深度学习模型的万无一失的方法

2020-05-02
6755

                     learning_rate_rewinding.png

随着越来越多的人工智能应用程序转移到智能手机上,深度学习模型越来越小,以允许应用程序更快地运行并节省电池电量。现在,麻省理工学院的研究人员有了一种更好的新方法来压缩模型。 

它们是如此简单,以至于他们在  上个月的一条推文中公开了它  :训练模型,修剪其最弱的连接,以快速的早期训练速率对其进行重新训练,然后重复进行,直到该模型变得所需的最小为止。 

“就是这样,” 麻省理工学院的博士生Alex Renda说  。“人们修剪模型的标准操作非常复杂。” 

Renda在本月远程召开的国际学习代表大会(ICLR)上讨论了该技术。Renda与  MIT 电气工程与计算机科学系(EECS)的  博士研究生  Jonathan Frankle 以及电气工程与计算机科学的助理教授Michael Carbin(计算机科学的所有成员)合着了  该书和人工科学实验室。  

 去年,在ICLR上,弗兰克和卡宾(Frankle and Carbin)屡获殊荣的彩票假说论文寻求更好的压缩技术  。他们表明,如果在训练的早期发现正确的子网,则深度神经网络仅能执行十分之一的连接数。随着对训练更大的深度学习模型的计算能力和能量需求呈指数级增长,这一启示一直持续到今天。这种增长的代价包括,由于不属于大型科技公司的研究人员争夺稀缺的计算资源,导致全球变暖的碳排放量增加以及创新潜力下降。每天的用户也会受到影响。大型AI模型会消耗手机带宽和电池电量。

但是在同事的建议下,弗兰克勒决定看看它可能会为修剪带来什么教训,这是一套通过删除不必要的连接或神经元来减小神经网络规模的技术。修剪算法已经存在了数十年,但是在神经网络在ImageNet竞赛中对图像进行分类的突破性成功之后,该领域出现了复苏。随着模型的变大,研究人员增加了人工神经元的层以提高性能,其他人则提出了降低它们的技术。 

现在担任麻省理工学院助理教授的宋瀚是一位先驱。在一系列有影响力的论文的基础上,Han提出了一种修剪算法,他称其为AMC或  用于模型压缩的AutoML,这仍然是行业标准。在Han的技术下,多余的神经元和连接被自动删除,并对模型进行重新训练以恢复其初始精度。 

作为对Han的工作的回应,Frankle最近在未发表的论文  中建议,  可以通过将较小的修剪后的模型倒回其初始参数或权重,并以更快的初始速率对较小的模型进行重新训练来进一步改善结果。 

在当前的ICLR研究中,研究人员意识到该模型可以简单地倒退到其早期训练速度,而无需摆弄任何参数。在任何修剪方案中,模型变得越小,精度就越低。但是,当研究人员将此新方法与Han的AMC或Frankle的重绕方法进行比较时,无论模型缩小多少,其效果都更好。 

目前尚不清楚修剪技术为何能如此出色地工作。研究人员说,他们将把这个问题留给其他人回答。研究人员说,对于那些想尝试的人,该算法与其他修剪方法一样容易实现,而无需花费时间进行调整。 

“这是'Book'中的修剪算法,” Frankle说。“这很明显,通用并且很简单。”

就Han而言,现在从一开始就将重点从压缩AI模型转移到了引导AI上,以设计小型,高效的模型。他最新的方法  “为所有人而做 ”也在ICLR上首次亮相。关于新的学习率方法,他说:“我很高兴看到新的修剪和再培训技术不断发展,使更多的人能够使用高性能的AI应用程序。” 

这项研究的支持来自国防高级研究计划局,谷歌,麻省理工学院的IBM沃森AI实验室,麻省理工学院的情报研究所和美国海军研究办公室。


已收藏 0
点赞 0

学术会议

【末轮截稿|连续5届稳定EI检索】第六届新材料与化学工程国际学术会议(AMCE 2026)
第六届新材料与化学工程国际学术会议(AMCE 2026)将于2026年7月17-19日在中国广州召开。会议将对行业科技发展目标和任务进行全面深入的探讨,总结国内外近期开发的先进材料研究和关键技术。
2026-07-17
【IEEE出版|往届2.5个月检索|中山大学主办】第六届计算机科学与区块链国际学术会议(CCSB 2026)
第六届计算机科学与区块链国际学术会议(CCSB 2026)定于2026年8月21-23日在珠海市召开。会议旨在为计算机科学与区块链相关领域的专家学者提供一个交流学术成果、促进合作交流的广泛平台。
2026-08-21
【IEEE出版|英国布鲁内尔大学主办】第七届计算机视觉与数据挖掘国际学术会议(ICCVDM 2026)
第七届计算机视觉与数据挖掘国际学术会议(ICCVDM 2026)定于2026年8月15-17日在英国伦敦召开。会议旨在为计算机视觉、数据挖掘等计算机领域的专家学者提供一个可交流学术成果、促进合作的平台
2026-08-15
【IEEE出版+国家级人才报告】第五届航空航天工程与系统国际研讨会(ISAES 2026)
由贵州理工学院主办的第五届航空航天工程与系统国际研讨会(ISAES 2026)于2026年7月24-26日在贵州贵阳市召开。涵盖多个领域的议题,航空器设计、航天器系统、航空动力推进、飞行控制技术等;
2026-07-24
IEEE出版,211高校主办|第五届人工智能、物联网和云计算技术国际会议(AIoTC 2026)
AIoTC 2025已见刊检索。AIoTC 2026主要围绕“人工智能、物联网和云计算技术”的最新研究展开,旨在荟聚世界各地该领域的专家、学者、研究人员及相关从业人员,分享研究成果
2026-07-17
【IEEE出版】第六届先进算法与神经网络国际学术会议(AANN 2026)
第六届先进算法与神经网络国际学术会议将于2026年8月7-9日在青岛召开,围绕“先进算法与神经网络”研究领域,为来自国内外高等院校、科学研究所的专家等提供分享专业经验,面对面交流新思想的国际平台。
2026-08-07
相关资讯

SCI一区文章和二区文章有区别吗

SCI分区是众所周知的,一区文章和二区文章其实也是相对于期刊的分区来说的,一区文章就是发表在SCI一区期刊上的文章,二区文章就是发表在SCI二区期刊上的文章,由于SCI分区共分为四个区,一区学术价值最大。

366741

0

2021-04-21

hm² 是什么单位?hm² 怎样换算?

hm² 是一个什么单位呢?hm² 怎样换算?它与我们常见的单位的换算又是怎么样的?本期艾思科蓝​小编带大家了解一下hm² 这个单位。

148744

1

2021-11-17

EI会议论文可以有几个作者

撰写并发表EI会议论文是许多科研工作者学术生涯中的重要环节。它不仅有助于传播研究成果,也是衡量研究者学术水平的指标之一。在论文筹备过程中,作者署名问题常常成为团队内部需要协调的事项,其中关于作者人数的疑问尤其普遍。实际上,EI会议论文的署名规则并无线性标准,它受到多方面因素的综合影响。

81

0

2026-06-26

如何查找学术会议召开信息

对于科研工作者和学术新人而言,及时获取准确、全面的学术会议信息,是把握领域前沿、拓展学术网络、展示研究成果的关键一步。然而,海量的信息散落在网络各处,如何高效精准地找到适合自己的会议,常常令人感到无从下手。

78

0

2026-06-26

做电子工程研究的测试是在第三方实验室做的论文里怎么写

在电子工程领域的研究工作中,出于设备条件、认证要求或结果公正性的考虑,许多关键测试往往需要在第三方实验室完成。这一做法虽然提升了研究的权威性与可信度,但在将其写入学术论文时,研究者常面临如何准确、规范地呈现这部分内容的挑战。这涉及到实验描述的清晰度、数据的可追溯性以及学术诚信的体现。一篇处理得当的论文,能够巧妙地将外部测试转化为论证的有力支点,而非让审稿人或读者产生过程“失控”的疑虑。那么,这些来自外部实验室的测试过程与结果,究竟该如何在论文中组织和表述呢。

93

0

2026-06-26

人工智能是研究什么

在科技浪潮奔涌的今天,人工智能已从一个前沿学术概念,深度融入社会生活的各个层面。从手机里的语音助手到工厂中的自动化机械臂,其身影无处不在。然而,当人们频繁谈论AI时,一个根本性的问题或许依然模糊:人工智能究竟研究什么?它远不止是让机器变得“聪明”那么简单,而是一个旨在探索、模拟和拓展智能本质的宏大科学领域。

93

0

2026-06-26
立即开启