主页 > 元宇宙 > 正文

机器学习的3大“疑难杂症”,因果学习是突破口 | 重庆大学刘礼(3)

2022-09-06 12:26来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

机器学习的3大“疑难杂症”,因果学习是突破口

目前,机器学习和大数据已经发展到了 你中有我 、 我中有你 的交融阶段。 尤其以深度学习为代表的机器学习已经取得了很好的进展。与此同时,这类方法的“缺陷”也日益突出。 特别是这几个最主要的问题: 可解释性 、 可泛化 、 稳健性 。 如何能同时推动这三个问题的解决? 一种很有潜力的方案就是把因果学习引进机器学习,即能促进机器学习方法的可解释,又改善稳定性同时还能泛化到不同场景。 不管深度神经网络还是其他的一些方法,大部分学的是变量和变量之间的相关性,忽略了变量和变量之间的因果性。后者正是因果学习的关注点。 例如,在癌症预测上,因果性就非常重要,究竟是哪些或者哪一个属性/变量导致癌症结果的发生,是医生和患者都想迫切知道的解释性问题。 长期以来,机器学习和因果学习是两个相对独立的研究方向,但现在,这种情况已经发生改变,有越来越多的人工智能学者意识到因果学习的这种潜力所在。 其中一位代表性人物就是“深度学习三巨头”之一的Bengio。 他曾表示:

将因果关系整合到AI当中已经成为目前的头等大事。当前的机器学习实现方法立足一个基本假设,即经过训练的AI系统在解决实际问题时,面对的数据与训练数据属于同一类型。但在现实生活中,情况不可能如此简单。 也是最近几年开始,他带领一支团队投入到这个新的研究重心中:将机器学习与因果推理相结合的因果表示学习。 另一支重要力量则是马普所的Schölkopf和他的团队,他们同样在探索如何创建可以学习因果表征的AI系统。 刘礼和他的团队亦将 “搭建其因果学习和机器学习的桥梁” 视为长期使命。 除了基础研究以外,他们还能背靠重庆的产业土壤,让因果框架理论实现落地。 比如在图像合成上,GAN和VAE的出现已经让人们看到图像合成的震撼效果,但是,这些生成能力在某些特别强调图像生成可控的场景下依然捉襟见肘。 像汽车造型生成,它和艺术图像生成有很大不同,必须要满足一定工业的标准,所以计算机辅助造型生成的时候,必须要做到可控。 而可控是目前一个很难解决的问题,这个场景也是刘礼实验室所重点探索的,即用因果的方法,从数据生成机制底层出发,发现数据的相关性,在相关性这个层面做特征解耦,去学习究竟什么因素最终导致了轮胎大小的变化等底层问题。 未来几年,图像合成、疾病诊断和行为识别这几个应用方向将是他们的重点攻关方向。

卷还是不卷?给青年学生的建议

在交流中,谈起自己的求学求知之路,刘礼总是提到,“将个人目标与国家重大需求结合”。 这不但是他对自己的要求,也是他对青年学生的希冀。现在计算机科学整个大领域都在讨论“内卷”现象,他尤其希望自己的经历和体会,能够帮助一些青年学生“破题”: “首先要重视基础理论,把基础理论打扎实。目前学习数据科学和机器学习特别的模块化,可能从网上搜到一个算法再拼装一下就能解决一个任务,这种以应用为导向的偏好在职场上快速解决问题的要求下是无可厚非的,但从学术界或者从最底层的逻辑上来说,这个现象也不一定是个好事。 这可能是我们的年轻人因为内卷得太厉害了,不得不快速出一些东西所造成的,不止本科生,一些博士生研究生也存在这个现象。 现在因果学习很热,可能把一些因果的概念揉到神经网络中有点效果之后,也能发很好的文章。不是说不能这么做,但是做完这个步骤,是不是可以反过来思考到底自己解决了什么样的核心问题。 这也是我的第二个建议,去思考国家的重大需求是什么,包括经济发展、社会治理和民生等等,我做的事情在这些方面上促进了什么?甚至是卡脖子的问题、引领性的问题上又贡献了多少。 现在年轻人都很厉害,能发很好的顶会文章,也能快速地解决一些问题,但到底这些方法和模型解决了什么样的重大需求? 我觉得,年轻人可能需要时常去考虑这一些问题,不管是去创业,还是继续留在学术圈,要站在更高的角度去追问核心问题,去审视自己做了什么。”

99科技网:http://www.99it.com.cn

相关推荐
AI 步态识别突破的秘密,藏在NVIDIA® DGX系统里 AI 步态识别突破的秘密,藏在NVIDIA® DGX系统里

常用的生物识别方法包括人脸识别、指纹识别、虹膜识别、步态识别等。

元宇宙2022-09-06

三年亏损超八亿  被明星股东不断“减持”的思必驰 三年亏损超八亿  被明星股东不断“减持”的思必驰

7月15日,思必驰科创板申请获上交所受理,保荐人中信证券。

元宇宙2022-09-06

马斯克把脑子上传到云端是一个彻头彻尾的商业和科技谎言 马斯克把脑子上传到云端是一个彻头彻尾的商业和科技谎言

据他自己说把自己的脑子传上了云端,很多人都信以为真了。

元宇宙2022-09-06

机器学习前沿:为什么上下文是一切 机器学习前沿:为什么上下文是一切

本文将讨论机器学习中上下文的重要性,以及后期绑定上下文如何提高机器启蒙

元宇宙2022-09-06

百度到2030年可能成为中国市值最高的公司 百度到2030年可能成为中国市值最高的公司

虽然百度可能不会在“搜索”领域看到直接竞争,但可能会承担来自社交媒体、

元宇宙2022-09-06

被罚「带薪休假」一个月后,谷歌解雇了「爱」上 AI 的他 被罚「带薪休假」一个月后,谷歌解雇了「爱」上 AI 的他

随着我们分享我们的 AI 原则,我们非常重视人工智能的发展,并继续致力于负

元宇宙2022-09-06

兰德:深度伪造技术对信息战的影响 兰德:深度伪造技术对信息战的影响

随着人工智能技术的发展,越来越多成熟的人工智能技术被用于虚假信息活动。

元宇宙2022-09-06

商汤的另一面 商汤的另一面

商汤科技限售股解禁后的股价波动,再度引发了外界对AI赛道的质疑与担忧。

元宇宙2022-09-06

大佬在线复盘:我在训练DALL·E时犯过的错 大佬在线复盘:我在训练DALL·E时犯过的错

DALL·E 是 OpenAi 去年推出的图像生成模型,它可以根据一句文本(caption)生成现

元宇宙2022-09-06

智能虚拟助手上位,何以成为世界上最具创新力的公司的代言人? 智能虚拟助手上位,何以成为世界上最具创新力的公司的代言人?

智能虚拟助手,也可以称之为AI机器人助手,正在更大力度和规模的出现在我们

元宇宙2022-09-06