主页 > 快资讯 > 正文

理论计算机科学家 Boaz Barak:深度学习并非“简单的统计”,二者距离已越来越远(3)

2022-08-28 10:27来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

3、我们希望,我们的模型能具有良好的总体损失,因为泛化误差/损失 很小(这种预测是基于实验数据所在的总体数据来获得的)。

图注:Bradley Efron经过对噪音的观察所复现的牛顿第一定律漫画 这种非常通用的范式包含了许多设置,包括最小二乘线性回归、最近邻、神经网络训练等等。在经典的统计设置中,我们期望观察到以下情况: 偏差/方差权衡:将 F 作为优化的模型集。(当我们处于非凸设置和/或有一个正则器项,我们可以让 F作为这种模型的集合,考虑到算法选择和正则器的影响,这些模型可以由算法以不可忽略的概率实现。) F 的偏差是对正确标签的最佳近似,可以通过元素 来实现。F 的类越大,偏差越小,当 ,偏差甚至可以是零。然而,当 F 类越大, 则需要越多样本来缩小其成员范围,从而算法输出模型中的方差就越大。总体泛化误差是偏差项和方差贡献的总和。 因此,统计学习通常会显示偏差/方差权衡,并通过正确模型复杂性的“金发姑娘选择”来最小化整体误差。事实上,Geman 等人也是这么做的,通过说“偏差-方差困境导致的基本限制适用于包括神经网络在内的所有非参数推理模型”来证明他们对神经网络的悲观情绪是合理的。 更多并非总是最好的。在统计学习中,获得更多的特征或数据并不一定能提高性能。例如,从包含许多不相关特征的数据中学习更具挑战性。类似地,从混合模型中学习,其中数据来自两个分布之一(例如 和 ),比独立学习单个更难。 收益递减。在许多情况下,将预测噪声降低到某个参数 ,其所需的数据点数量在某些参数 k 下以 的形式拓展。在这种情况下,需要大约 k 个样本来“起飞”,而一旦这样做,则会面临收益递减的制度,即假设花耗 n 个点来达到(比如)90%的准确度,那么想要将准确度提高到95%,则大约需要另外 3n 个点。一般来说,随着资源增加(无论是数据、模型的复杂性,还是计算),我们希望捕捉到更多更细的区别,而不是解锁新的质量上的能力。 对损失、数据的强烈依赖。在将模型拟合到高维数据时,一个很小的细节就有可能造成结果的很大不同。统计学家知道,诸如 L1 或 L2 正则化器之类的选择很重要,更不用说使用完全不同的数据集,不同数量的高维优化器将具有极大的差异性。 数据点没有自然的“难度”(至少在某些情况下)。传统上认为,数据点是独立于某个分布进行采样的。尽管靠近决策边界的点可能更难分类,但考虑到高维度的测量集中现象,可预计大多数点的距离将存在相似的情况。因此,至少在经典数据分布中,并不期望点在其难度水平上有很大差异。然而,混合模型可以显示这种差异的不同难度级别,所以与上述其他问题不同,这种差异在统计设置中不会非常令人惊讶。

99科技网:http://www.99it.com.cn

相关推荐
中科院上海分院——科学家“逆行”守护实验室 中科院上海分院——科学家“逆行”守护实验室

面对疫情挑战,中科院上海分院许多科技工作者背上行囊,住进实验室,既有年

快资讯2022-08-13

经典新星爆发过程中白矮星混合理论研究取得新进展 经典新星爆发过程中白矮星混合理论研究取得新进展

经典新星是发生在白矮星表面的热核反应现象, 对星系化学演化起着重要的作用

快资讯2022-08-12

科学家研究了植物在月球上生长的可行性,月壤中首次成功培育出植物 科学家研究了植物在月球上生长的可行性,月壤中首次成功培育出植物

《通讯·生物学》杂志12日发表一项太空生物学实验,科学家研究了植物在月球

快资讯2022-08-10

科学家构建高质量水稻泛基因组 科学家构建高质量水稻泛基因组

近日,中国农业科学院作物科学研究所水稻分子设计技术与应用创新团队和上海

快资讯2022-08-02

科学家实现可调控的马约拉纳零能模格点阵列,助力量子计算技术进一步发展 科学家实现可调控的马约拉纳零能模格点阵列,助力量子计算技术进一步发展

新华社北京6月8日电(记者张泉)马约拉纳零能模是一类存在于固体材料中的准

快资讯2022-07-26

量子计算机或能创造全新物质 量子计算机或能创造全新物质

英国科学家发表最新研究称,他们可以调整量子计算机内量子比特之间的相互作

快资讯2022-07-23

科学家开发出三维垂直场效应晶体管 科学家开发出三维垂直场效应晶体管

通过铁电栅极绝缘体和原子层沉积氧化物半导体通道,日本科学家制造了三维垂

快资讯2022-07-22

我科学家成功提升量子精密测量灵敏度 我科学家成功提升量子精密测量灵敏度

本报北京6月19日电 记者邓晖从清华大学获悉,近日,该校交叉信息研究院孙麓

快资讯2022-07-22

一个科学家发明了一个具有人工智能的机器人 一个小球大小 左右各有 一个科学家发明了一个具有人工智能的机器人 一个小球大小 左右各有

飞天法宝 Flubber (1997) 剧情:从事研究工作的菲利普博士,其生活可用一个“忙

快资讯2022-07-21

360安全卫士如何显示计算机属性和配置 360安全卫士如何显示计算机属性和配置

大家好,这是文章开头。 今天,我们将讨论360安全防护如何显示有关计算机属

快资讯2022-07-21