主页 > 快资讯 > 正文

斯坦福李飞飞团队新研究登Nature子刊:实现可信AI,数据的设计、完善、评估是关键(3)

2022-09-15 12:48来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

图 2c:数据过滤前后不同模型的对象识别测试性能比较。括号中的数字表示过滤掉噪声数据后剩下的训练数据点的数量,结果汇总在五个随机种子上,阴影区域代表 95% 置信区间。

这就是数据评估的意义所在,它旨在量化不同数据的重要程度,并过滤掉可能由于质量差或偏差而损害模型性能的数据。

数据清洗

在本文中,作者介绍了两种数据评估方法来帮助清洗数据:

一种方法是测量在训练过程中删除不同数据时 AI 模型表现的变化,这可以采用数据的 Shapley 值或影响近似值来获得,如下图 3a。这种方法能够有效计算大型 AI 模型的评估。

图3a:数据评估。当在训练中删除特定点(图中被划掉的褪色五角星)时,数据的 Shapley 值测量在不同数据子集上训练的模型的性能变化,从而来量化每个数据点(五角星符号)的值。颜色表示类别标签。

另一种方法则是预测不确定性来检测质量差的数据点。数据点的人类注释可能会系统地偏离 AI 模型预测,置信学习算法可以检测出这些偏差,在 ImageNet 等常见基准测试中发现超过 3% 的测试数据被错误标注。过滤掉这些错误可以大大提升模型的性能。

数据标注

数据标注也是数据偏差的一个主要来源。尽管 AI 模型可以容忍一定程度的随机标签噪声,但有偏差的错误会产生有偏差的模型。目前,我们主要依赖于人工标注,成本很昂贵,比如标注单个 LIDAR 扫描的成本可能超过 30 美元,因为它是三维数据,标注者需要绘制出三维边界框,比一般的标注任务要求更高。

因此作者认为,我们需要仔细校准 MTurk 等众包平台上的标注工具,提供一致的标注规则。在医疗环领域,还要考虑到标注人员可能需要专业知识或者可能有无法众包的敏感数据。

降低注释成本的一种方法是数据编程。在数据编程中,AI 开发人员不再需要手动标记数据点,而是编写程序标签函数来自动标注训练集。如图 3b, 使用用户定义的标签函数为每个输入自动生成多个可能有噪声的标签后,我们可以设计额外的算法 ,来聚合多个标签功能以减少噪声。

图 3b:数据编程。

另一种降低标注成本的「人在回路」(human-in-the-loop)方法是优先考虑最有价值的数据,以便我们通过主动学习(active learning)来进行标注。主动学习从最佳实验设计中汲取思想,在主动学习中,算法从一组未标注的数据点中选择信息量最大的点,比如具有高信息增益的点或模型在其上具有不确定性的点吗,然后再进行人工标注。这种方法的好处是,所需的数据数量比标准的监督学习所需的数据量要少得多。

99科技网:http://www.99it.com.cn

相关推荐
斯坦福李飞飞团队新研究登 Nature 子刊:实现可信 AI,数据的设计、完善、评估是关键 斯坦福李飞飞团队新研究登 Nature 子刊:实现可信 AI,数据的设计、完善、评估是关键

数据的设计、完善、评估三大步骤是关键。

快资讯2022-09-15

斯坦福李飞飞团队新研究登 Nature 子刊:实现可信 AI,数据的设计、完善、评估是关键 斯坦福李飞飞团队新研究登 Nature 子刊:实现可信 AI,数据的设计、完善、评估是关键

数据的设计、完善、评估三大步骤是关键。

快资讯2022-09-09

自动驾驶赛道升温,李彦宏预言L4比L3更快商用或成真 自动驾驶赛道升温,李彦宏预言L4比L3更快商用或成真

自动驾驶政策法规的出台只是时间问题,届时包括百度在内的所有玩家都将迎来

快资讯2022-09-06

重磅!斯坦福李飞飞教授团队新研究登 Nature 子刊 重磅!斯坦福李飞飞教授团队新研究登 Nature 子刊

在当前 AI 模型的开发以模型为中心转向以数据为中心的趋势下,数据的质量变

快资讯2022-09-02

Omniverse激活 “数字虫洞”,围观《星球:重启》数字人李星澜如何诞生? Omniverse激活 “数字虫洞”,围观《星球:重启》数字人李星澜如何诞生?

AI几乎是贯穿英伟达历届GTC的不衰主题,而与AI密不可分的机器人、数字人则是

快资讯2022-09-01

斯坦福李飞飞团队新研究登Nature子刊:实现可信AI,数据的设计、完善、评估是关键 斯坦福李飞飞团队新研究登Nature子刊:实现可信AI,数据的设计、完善、评估是关键

在当前 AI 模型的开发以模型为中心转向以数据为中心的趋势下,数据的质量变

快资讯2022-09-01

斯坦福李飞飞团队新研究登 Nature 子刊:实现可信 AI,数据的设计、完善、评估是关键 斯坦福李飞飞团队新研究登 Nature 子刊:实现可信 AI,数据的设计、完善、评估是关键

数据的设计、完善、评估三大步骤是关键。

快资讯2022-09-01

AI大牛李沐装机视频来了!你也能练100亿的大模型 AI大牛李沐装机视频来了!你也能练100亿的大模型

AI大牛沐神来装机了,还是训练100亿参数模型那种。

快资讯2022-08-30

市场监管总局李常青:建立新能源汽车报告事故制度 市场监管总局李常青:建立新能源汽车报告事故制度

8月1日,第九届智能网联汽车技术年会在北京开幕,国家市场监管总局质量发展

快资讯2022-08-01

李斌被曝直播时称蔚来每年只开发一款手机,就像苹果一样 李斌被曝直播时称蔚来每年只开发一款手机,就像苹果一样

IT之家7 月 28 日消息,近两年随着万物互联的兴起,不少车企和手机厂商都在互

快资讯2022-07-28