主页 > 快资讯 > 正文

万字长文:详解现代AI和深度学习发展史(7)

2023-03-01 12:46来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

1995年:神经概率语言模型

1995年,Schmidhuber提出了一个优秀的神经概率文本模型,其基本概念在2003年被重新使用。 2001年,Schmidhuber表明LSTM可以学习HMM等传统模型无法学习的语言。 2016年的谷歌翻译,则是基于两个连接的LSTM(白皮书提到LSTM超过50次),一个用于传入文本,一个用于传出翻译。 同年,谷歌数据中心用于推理的超强计算能力中,有超过四分之一用于LSTM(还有5%用于另一种流行的深度学习技术,即CNN)。 到了2017年,LSTM还为Facebook的机器翻译(每周超过300亿次翻译)、苹果在大约10亿部iPhone上的Quicktype、亚马逊的Alexa的语音、谷歌的图像标题生成和自动电子邮件回答等提供支持。 当然,Schmidhuber的LSTM也被大量用于医疗保健和医疗诊断——简单的谷歌学术搜索就能找到无数标题中带有「LSTM」的医学文章。 2015年5月,Schmidhuber团队基于LSTM原理提出了Highway Network,第一个具有数百层的非常深的FNN(以前的NN最多只有几十层)。微软的ResNet(赢得了ImageNet 2015比赛)便是它的一个版本。 早期Highway Net在ImageNet上的表现与ResNet大致相同。Highway Net的变体也被用于某些算法任务,在这些任务中,纯残差层的效果并不理想 。

LSTM/Highway Net原理是现代深度学习的核心

深度学习的核心是NN深度。 在20世纪90年代,LSTM为有监督的递归NN带来了基本无限的深度;在2000年,受LSTM启发的Highway Net为前馈NN带来了深度。 现在,LSTM已经成为20世纪被引用最多的NN,而Highway Net的其中一个版本ResNet,则是21世纪被引用最多的NN。

十六、1980至今:在没有老师的情况下学习行动的NNN

此外,NN也与强化学习(RL)有关。 虽然部分问题可以通过早在20世纪80年代之前发明的非神经技术来解决。比如,蒙特卡洛树搜索(MC)、动态规划(DP)、人工进化、α-β-剪枝、控制理论和系统识别、随机梯度下降,以及通用搜索技术。但深度FNN和RNN可以为某些类型的RL任务带来更好的效果。 一般来说,强化学习智能体必须学会如何在没有老师的帮助下,与一个动态的、最初未知的、部分可观察的环境互动,从而使预期的累积奖励信号最大化。在行动和可感知的结果之间可能存在任意的、先验的未知延迟。 当环境有一个马尔可夫接口,使RL智能体的输入可以传达确定下一个最佳行动所需的所有信息时,基于动态规划(DP)/时序差分(TD)/蒙特卡洛树搜索(MC)的RL会非常成功。 对于没有马尔可夫接口的更复杂的情况,智能体不仅要考虑现在的输入,还要考虑以前输入的历史。对此,由RL算法和LSTM形成的组合已经成为了一种标准方案,特别是通过策略梯度训练的LSTM。 例如,在2018年,一个经过PG训练的LSTM是OpenAI著名的Dactyl的核心,它在没有老师的情况下学会了控制一只灵巧的机器人手。 视频游戏也是如此。 2019年,DeepMind(由Schmidhuber实验室的一名学生共同创立)在《星际争霸》游戏中击败了职业选手,其中用到的Alphastar,就是有一个由PG训练的深度LSTM核心。 与此同时,RL LSTM(占模型总参数数的84%)也是著名的OpenAI Five的核心,它在Dota 2中击败了专业的人类玩家。 RL的未来将是用复杂输入流的紧凑时空抽象来学习/组合/规划,也就是关于常识推理和学习思考。 Schmidhuber在1990-91年发表的论文中提出,自监督的神经历史压缩器,可以学习多层次的抽象和多时间尺度上的表征概念;而基于端到端的可区分NN的子目标生成器,则可以通过梯度下降学习分层的行动计划。 在随后的1997年和2015-18年,更复杂的学习抽象思维的方法被发表。

99科技网:http://www.99it.com.cn

相关推荐
万字长文:ChatGPT能否成为互联网后下一个系统性机会? 万字长文:ChatGPT能否成为互联网后下一个系统性机会?

2023年险峰线上沙龙的第一期,我们和四位行业大牛聊了聊最近大火的ChatGPT。

快资讯2023-02-24

《张朝阳的物理课》详解各元素核外电子排布 《张朝阳的物理课》详解各元素核外电子排布

如何求解氢原子薛定谔方程?原子核 外的 电子又是如何排布的?6月10日,《张

快资讯2022-07-24

Notes的新功能:允许用户分享长文章 Notes的新功能:允许用户分享长文章

6月23日消息,推特周三表示,它正在测试一个名叫 Notes的新功能 ,该功能 允许

快资讯2022-06-23

7万字“陈情书”催地产商复工,郑州670名硕博业主被套:我们不要烂尾楼 7万字“陈情书”催地产商复工,郑州670名硕博业主被套:我们不要烂尾楼

写文章并不是业主们的日常,但自永威金桥西棠项目停工以来,这件事对他们来

快资讯2022-06-22

千万粉丝博主Unbox Therapy详解海信激光电视与投影的区别 千万粉丝博主Unbox Therapy详解海信激光电视与投影的区别

原标题:千万粉丝博主UnboxTherapy详解海信激光电视与投影的区别 它非常独一无

快资讯2021-11-19

领主世界:大火的元宇宙母性我有什么关系(万字长文) 领主世界:大火的元宇宙母性我有什么关系(万字长文)

原标题:领主世界:大火的元宇宙母性我有什么关系(万字长文) 领主世界:

快资讯2021-06-16

全棉时代道歉疑似打广告 发长文大段篇幅“王婆卖瓜” 全棉时代道歉疑似打广告 发长文大段篇幅“王婆卖瓜”

原标题:全棉时代道歉疑似打广告 发长文大段篇幅王婆卖瓜 全棉时代打广告打

快资讯2021-01-11

蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕 一文详解最佳解题方案 蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕 一文详解最佳解题方案

原标题:蚂蚁金服首届ATEC开发者大赛人工智能大赛圆满落幕 一文详解最佳解题

快资讯2018-10-17

iOS12正式版耗电严重吗?iOS12耗电问题详解 iOS12正式版耗电严重吗?iOS12耗电问题详解

原标题:iOS12正式版耗电严重吗?iOS12耗电问题详解 2018年苹果秋季发布会,iO

快资讯2018-09-19

腾讯人才培养大揭秘  内附近万字的详解 腾讯人才培养大揭秘 内附近万字的详解

原标题: 腾讯人才培养大揭秘 内附近万字的详解 形散神聚:腾讯COE的组织架构

快资讯2017-05-14