您当前浏览器版本过低,为了不影响您的使用,建议您使用最新的谷歌浏览器、火狐浏览器、 360浏览器,更换浏览器后使用更流畅!(注意!双核浏览器请切换为极速模式)
400-607-9388

缩小深度学习模型的万无一失的方法

2020-05-02
5209

                     learning_rate_rewinding.png

随着越来越多的人工智能应用程序转移到智能手机上,深度学习模型越来越小,以允许应用程序更快地运行并节省电池电量。现在,麻省理工学院的研究人员有了一种更好的新方法来压缩模型。 

它们是如此简单,以至于他们在  上个月的一条推文中公开了它  :训练模型,修剪其最弱的连接,以快速的早期训练速率对其进行重新训练,然后重复进行,直到该模型变得所需的最小为止。 

“就是这样,” 麻省理工学院的博士生Alex Renda说  。“人们修剪模型的标准操作非常复杂。” 

Renda在本月远程召开的国际学习代表大会(ICLR)上讨论了该技术。Renda与  MIT 电气工程与计算机科学系(EECS)的  博士研究生  Jonathan Frankle 以及电气工程与计算机科学的助理教授Michael Carbin(计算机科学的所有成员)合着了  该书和人工科学实验室。  

 去年,在ICLR上,弗兰克和卡宾(Frankle and Carbin)屡获殊荣的彩票假说论文寻求更好的压缩技术  。他们表明,如果在训练的早期发现正确的子网,则深度神经网络仅能执行十分之一的连接数。随着对训练更大的深度学习模型的计算能力和能量需求呈指数级增长,这一启示一直持续到今天。这种增长的代价包括,由于不属于大型科技公司的研究人员争夺稀缺的计算资源,导致全球变暖的碳排放量增加以及创新潜力下降。每天的用户也会受到影响。大型AI模型会消耗手机带宽和电池电量。

但是在同事的建议下,弗兰克勒决定看看它可能会为修剪带来什么教训,这是一套通过删除不必要的连接或神经元来减小神经网络规模的技术。修剪算法已经存在了数十年,但是在神经网络在ImageNet竞赛中对图像进行分类的突破性成功之后,该领域出现了复苏。随着模型的变大,研究人员增加了人工神经元的层以提高性能,其他人则提出了降低它们的技术。 

现在担任麻省理工学院助理教授的宋瀚是一位先驱。在一系列有影响力的论文的基础上,Han提出了一种修剪算法,他称其为AMC或  用于模型压缩的AutoML,这仍然是行业标准。在Han的技术下,多余的神经元和连接被自动删除,并对模型进行重新训练以恢复其初始精度。 

作为对Han的工作的回应,Frankle最近在未发表的论文  中建议,  可以通过将较小的修剪后的模型倒回其初始参数或权重,并以更快的初始速率对较小的模型进行重新训练来进一步改善结果。 

在当前的ICLR研究中,研究人员意识到该模型可以简单地倒退到其早期训练速度,而无需摆弄任何参数。在任何修剪方案中,模型变得越小,精度就越低。但是,当研究人员将此新方法与Han的AMC或Frankle的重绕方法进行比较时,无论模型缩小多少,其效果都更好。 

目前尚不清楚修剪技术为何能如此出色地工作。研究人员说,他们将把这个问题留给其他人回答。研究人员说,对于那些想尝试的人,该算法与其他修剪方法一样容易实现,而无需花费时间进行调整。 

“这是'Book'中的修剪算法,” Frankle说。“这很明显,通用并且很简单。”

就Han而言,现在从一开始就将重点从压缩AI模型转移到了引导AI上,以设计小型,高效的模型。他最新的方法  “为所有人而做 ”也在ICLR上首次亮相。关于新的学习率方法,他说:“我很高兴看到新的修剪和再培训技术不断发展,使更多的人能够使用高性能的AI应用程序。” 

这项研究的支持来自国防高级研究计划局,谷歌,麻省理工学院的IBM沃森AI实验室,麻省理工学院的情报研究所和美国海军研究办公室。


已收藏 0
点赞 0

学术会议

【IEEE出版|往届会后3个月EI检索】第三届人工智能与自动化控制国际学术会议(AIAC 2025)
第三届人工智能与自动化控制国际学术会议将于法国巴黎举行,本次会议将带来涵盖机器学习、深度学习、智能系统设计、自适应控制、机器人技术等多个前沿话题的精彩演讲和研讨,将激发新的研究思路,促进科技创新。
2025-10-15
【ACM 独立出版∣往届已EI、Scopus检索∣合作SSCI】第二届数字经济与计算机科学国际学术会议(DECS 2025)
第二届数字经济与计算机科学国际学术会议(DECS 2025)将于10月17日-10月19日在武汉召开,本次会议主要围绕计算机技术数字经济等相关主题展开广泛深入的研讨与交流。
2025-10-17
【IEEE出版|已连续5届稳定快速Ei检索】第六届计算机工程与智能控制国际学术会议(ICCEIC 2025)
第六届计算机工程与智能控制学术会议(ICCEIC 2025)将于2024年10月17日至19日在广州举办,聚焦计算机工程与智能控制前沿,涵盖网络安全、硬件系统、软件工程、嵌入式创新等多个核心议题及交叉
2025-10-17
【SPIE独立出版丨连续多年EI稳定检索!】第七届地球科学与遥感测绘国际学术会议(GRSM 2025)
为交流近年来国内外在地球、地理科学和遥感测绘领域的理论、技术和应用的最新进展,展示最新成果,第七届地球科学与遥感测绘国际学术会议将于2025年10月17-19日在中国-新疆-乌鲁木齐召开。
2025-10-17
【IEEE出版|往届快至会后2个月检索|终轮征稿】第五届电子信息工程与计算机科学国际会议(EIECS 2025)
2025年第五届电子信息工程与计算机科学国际会议(EIECS 2025)将于2025年9月26-28日在中国青岛举行,会议由长春理工大学主办,青岛大学承办,欢迎广大学者参与。
2025-09-26
【稳定检索|线上线下参会|马理工主办】第十一届建筑、土木与水利工程国际学术会议(ICACHE 2025)
第十一届建筑、土木与水利工程国际学术会议(ICACHE 2025)将于2025年10月17-19日在马来西亚新山市隆重举行。大会诚邀国内外高校、科研机构专家、学者、及其他相关人员投稿与参会交流。
2025-10-17
相关资讯

SCI一区文章和二区文章有区别吗

SCI分区是众所周知的,一区文章和二区文章其实也是相对于期刊的分区来说的,一区文章就是发表在SCI一区期刊上的文章,二区文章就是发表在SCI二区期刊上的文章,由于SCI分区共分为四个区,一区学术价值最大。

294336

0

2021-04-21

hm² 是什么单位?hm² 怎样换算?

hm² 是一个什么单位呢?hm² 怎样换算?它与我们常见的单位的换算又是怎么样的?本期艾思科蓝​小编带大家了解一下hm² 这个单位。

135558

1

2021-11-17

SCI投稿质量评估

SCI投稿质量评估,在学术研究领域,发表SCI期刊论文不仅是衡量研究者学术水平的重要指标,更是推动科学知识传播与创新的重要途径。然而,随着全球科研竞争日趋激烈,投稿数量激增,期刊编辑和审稿人面临巨大的审稿压力。因此,在提交稿件之前,研究者对自身论文进行系统、全面的质量评估,已成为提高录用几率、加速发表进程的关键环节。本文旨在深入探讨SCI投稿质量评估的核心要素,为研究者提供实用且细致的指导,助力其学术成果在国际舞台上获得认可。

83

0

2025-09-17

SCI投稿没有回复

SCI投稿没有回复?在学术研究的征途中,发表SCI论文是每位研究者追求认可与影响的重要里程碑。然而,许多学者都曾经历过这样的困境:精心撰写的稿件投递后,如同石沉大海,迟迟未见回复。这种等待不仅消耗时间与精力,更可能带来焦虑与自我怀疑。本文将从多个角度分析SCI投稿无回复的原因,并提供实用的应对策略,帮助研究者在这一过程中保持信心与效率。

68

0

2025-09-17

SCI投稿角色选择

SCI投稿角色选择,在学术研究的宏伟殿堂中,SCI论文的发表无疑是研究成果获得国际认可的重要里程碑。然而,许多研究者往往将注意力集中于实验设计、数据分析和论文撰写,却忽略了投稿过程中一个至关重要的环节——作者角色的正确选择与界定。作者署名不仅关乎学术荣誉的分配,更涉及学术伦理、责任归属以及未来合作关系的维护。在学术出版规范日益严格的今天,恰当的作者角色选择已成为科研工作者必须掌握的核心技能之一。

70

0

2025-09-17

SCI作者投稿排序

SCI作者投稿排序,在学术研究领域,SCI论文的发表不仅是科研成果的重要体现,更是学者学术影响力的关键衡量标准。作者排序作为论文投稿过程中的核心环节,其规范性直接关系到学术贡献的合理认定与团队合作的公平性。然而,在实际操作中,作者排序问题常因沟通不足、标准模糊或文化差异而引发争议。

71

0

2025-09-17