主页 > 快资讯 > 正文

万字长文:详解现代AI和深度学习发展史(6)

2023-03-01 12:46来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

十三、1991年4月:通过自监督的预训练进行深度学习

今天最强大的NN往往是非常深的,也就是说,它们有很多层的神经元或很多后续的计算阶段。 然而,在20世纪90年代之前,基于梯度的训练对深度NN并不奏效(只对浅层NN有效)。 与前馈NN(FNN)不同的是,RNN有反馈连接。这使得RNN成为强大的、通用的、平行序列的计算机,可以处理任意长度的输入序列(比如语音或者视频)。 然而,在20世纪90年代之前,RNN在实践中未能学习深层次的问题。 为此,Schmidhuber建立了一个自监督的RNN层次结构,来尝试实现「通用深度学习」。

1991年4月:将一个NN蒸馏成另一个NN

通过使用Schmidhuber在1991年提出的NN蒸馏程序,上述神经历史压缩机的分层内部表征可以被压缩成一个单一的递归NN(RNN)。 在这里,教师NN的知识被「蒸馏」到学生NN中,方法是训练学生NN模仿教师NN的行为(同时也重新训练学生NN,从而保证之前学到的技能不会被忘记)。NN蒸馏法也在许多年后被重新发表,并在今天被广泛使用。

十四、1991年6月:基本问题——梯度消失

Schmidhuber的第一个学生Sepp Hochreiter在1991年的毕业论文中发现并分析了基本的深度学习问题。 深度NN受到现在著名的梯度消失问题的困扰:在典型的深度或递归网络中,反向传播的错误信号要么迅速缩小,要么超出界限增长。在这两种情况下,学习都会失败。

十五、1991年6月:LSTM/Highway Net/ResNet的基础

长短期记忆(LSTM)递归神经网络克服了Sepp Hochreiter在上述1991年的毕业论文中指出的基本深度学习问题。 在1997年发表了经同行评审的论文之后(现在是20世纪被引用最多的NN文章),Schmidhuber的学生Felix Gers和Alex Graves等人,进一步改进了LSTM及其训练程序。 1999-2000年发表的LSTM变体——带有遗忘门的「vanilla LSTM架构」,在如今谷歌的Tensorflow中依然还在应用。 2005年,Schmidhuber首次发表了LSTM在时间上完全反向传播和双向传播的文章(同样也被广泛使用)。 2006年一个里程碑式的训练方法是「联结主义时间分类」(CTC),用于同时对齐和识别序列。 Schmidhuber的团队在2007年成功地将CTC训练的LSTM应用于语音(也有分层的LSTM堆栈),第一次实现了卓越的端到端神经语音识别效果。 2009年,通过Alex的努力,由CTC训练的LSTM成为第一个赢得国际比赛的RNN,即三个ICDAR 2009手写比赛(法语、波斯语、阿拉伯语)。这引起了业界的极大兴趣。LSTM很快被用于所有涉及序列数据的场合,比如语音和视频。 2015年,CTC-LSTM的组合极大地改善了谷歌在安卓智能手机上的语音识别性能。直到2019年,谷歌在移动端搭载的语音识别仍然是基于LSTM。

99科技网:http://www.99it.com.cn

相关推荐
万字长文:ChatGPT能否成为互联网后下一个系统性机会? 万字长文:ChatGPT能否成为互联网后下一个系统性机会?

2023年险峰线上沙龙的第一期,我们和四位行业大牛聊了聊最近大火的ChatGPT。

快资讯2023-02-24

《张朝阳的物理课》详解各元素核外电子排布 《张朝阳的物理课》详解各元素核外电子排布

如何求解氢原子薛定谔方程?原子核 外的 电子又是如何排布的?6月10日,《张

快资讯2022-07-24

Notes的新功能:允许用户分享长文章 Notes的新功能:允许用户分享长文章

6月23日消息,推特周三表示,它正在测试一个名叫 Notes的新功能 ,该功能 允许

快资讯2022-06-23

7万字“陈情书”催地产商复工,郑州670名硕博业主被套:我们不要烂尾楼 7万字“陈情书”催地产商复工,郑州670名硕博业主被套:我们不要烂尾楼

写文章并不是业主们的日常,但自永威金桥西棠项目停工以来,这件事对他们来

快资讯2022-06-22

千万粉丝博主Unbox Therapy详解海信激光电视与投影的区别 千万粉丝博主Unbox Therapy详解海信激光电视与投影的区别

原标题:千万粉丝博主UnboxTherapy详解海信激光电视与投影的区别 它非常独一无

快资讯2021-11-19

领主世界:大火的元宇宙母性我有什么关系(万字长文) 领主世界:大火的元宇宙母性我有什么关系(万字长文)

原标题:领主世界:大火的元宇宙母性我有什么关系(万字长文) 领主世界:

快资讯2021-06-16

全棉时代道歉疑似打广告 发长文大段篇幅“王婆卖瓜” 全棉时代道歉疑似打广告 发长文大段篇幅“王婆卖瓜”

原标题:全棉时代道歉疑似打广告 发长文大段篇幅王婆卖瓜 全棉时代打广告打

快资讯2021-01-11

蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕 一文详解最佳解题方案 蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕 一文详解最佳解题方案

原标题:蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕 一文详解最佳解题

快资讯2018-10-17

iOS12正式版耗电严重吗?iOS12耗电问题详解 iOS12正式版耗电严重吗?iOS12耗电问题详解

原标题:iOS12正式版耗电严重吗?iOS12耗电问题详解 2018年苹果秋季发布会,iO

快资讯2018-09-19

腾讯人才培养大揭秘  内附近万字的详解 腾讯人才培养大揭秘 内附近万字的详解

原标题: 腾讯人才培养大揭秘 内附近万字的详解 形散神聚:腾讯COE的组织架构

快资讯2017-05-14