主页 > 快资讯 > 正文

阿里“通义”大模型炸场WAIC,背后要从一篇论文讲起(2)

2022-09-05 11:08来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

落地场景200+,核心工具均开源

大模型落地难的原因,通常有两个。 其一, 使用成本太高 。以往对于预训练大模型来说,即使微调,依赖的底层资源也不低,如果对效果有进一步要求,则需要继续提升训练数据规模,成本还会进一步提升。 其二, 落地效果有限 。对于部分应用场景而言,大模型并不是一个性价比高的选择,实际使用时为了部署到特定设备上,往往需要模型压缩,导致性能下降明显。 但据介绍,阿里推出的 通义大模型 ,在电商跨模态搜索、AI辅助设计、法律文书学习、医疗文本理解、开放域人机对话等200多个场景中应用落地时,均达到了 2%~10% 的效果提升。 这是怎么做到的?阿里采用了两种方法。 一方面,基于“大一统”思路做出通用大模型,再结合行业知识减少标注成本。 以法律场景为例,此前阿里已经与浙江省高院、浙江大学联合推出了一个能全流程辅助法官审判的AI,目前适用案件达到5000+,帮助法官提升效率达到40%。 这只法律AI实现了“10案连审”的能力,即在30分钟的开庭时间内,辅助法官连续审理10个简单案例,极大地提升了这一流程的效率。 现在,这只AI,已经基于通用大模型+行业knowhow的思路进行迭代。通用大模型基于“大一统”技术,预训练时就已经具备了很强的理解和生成能力,只需再针对特定任务进行简单微调。 以AI学习法律文书时需要完成的“要素化抽取”为例,这里需要AI从大量的电子卷宗中提取有效信息,比如原被告信息、事件描述等,其中涉及的文本理解与抽取能力,就属于通用大模型的能力强项内。 另一方面,研发出多种高质量的大模型“浓缩”技术,可以根据客户的资源情况做快速适配,降低大模型落地的困难。 例如达摩院推出的大模型落地技术S4 (Sound、Sparse、Scarce、Scale) 框架,就包含了各种微调算法和模型压缩算法,本质上是希望将 稀疏化 等技术应用到到百亿量级的大模型中。 基于这一技术,阿里的270亿参数语言大模型PLUG在压缩率达99%的情况下,多项任务的精度损失在1%以内。 这意味着 百亿参数大模型 也可能在几乎不损失精度的情况下进行稀疏化,最终实现 单卡运行 。 值得一提的是,无论是这次发布的多模态统一底座模型 M6-OFA ,还是超大模型落地关键技术 S4 框架,又或是之前发布的通义语言大模型AliceMind-PLUG、多模态理解与生成统一模型AliceMind-mPLUG等核心能力, 均已全部开源 。 但即便具备将通用大模型落地的技术实力,仍然绕不过一个最根本的问题: 为何阿里要选择“大一统”这条技术路线?

激发大模型“通用”的潜力

99科技网:http://www.99it.com.cn

相关推荐
上海张江×百度飞桨打了个样,AI赋能这事儿可算有“参考答案”了 上海张江×百度飞桨打了个样,AI赋能这事儿可算有“参考答案”了

说起飞桨的这个人工智能产业赋能中心,其实是百度和上海张江集团的共同手笔

快资讯2022-09-05

覆盖全国多地,惠及超18万人次:“智体双百”公益计划持续推进 覆盖全国多地,惠及超18万人次:“智体双百”公益计划持续推进

2021年9月,腾讯智体双百公益计划正式对外公布。该计划由腾讯成长守护、腾讯

快资讯2022-09-02

“换挡”进行时,百度云扛起“第二曲线” “换挡”进行时,百度云扛起“第二曲线”

全面押注AI 5年,百度由技术驱动的“营收换挡”,终于出现完成时。

快资讯2022-09-02

“饭圈女孩”,星海浏览器,让你离爱豆更进一步! “饭圈女孩”,星海浏览器,让你离爱豆更进一步!

《Gee》、《Oh!》、《Run Devil Run》、《The Boys》、《I GOT A BOY》、《Mr.Mr.》...韩国

快资讯2022-09-02

十余年深耕人工智能,百度“上云”“划桨”“驾车”行 十余年深耕人工智能,百度“上云”“划桨”“驾车”行

在科技领域,最难的一直都是持之以恒,心无旁骛地坚持。

快资讯2022-09-02

科大讯飞稳中求进 探寻“不确定”中的“确定性” 科大讯飞稳中求进 探寻“不确定”中的“确定性”

在这个“唯一的不变是变化”的世界,最大的风险,其实是 停滞不前。学会与

快资讯2022-09-02

通用多模态基础模型BEiT-3:引领文本、图像、多模态预训练迈向“大一统” 通用多模态基础模型BEiT-3:引领文本、图像、多模态预训练迈向“大一统”

技术和模型的统一将会使得 AI 模型逐步标准化、规模化,从而为大范围产业化

快资讯2022-09-01

自动化技术支持工具开发商Mavenoid完成3000万美元B轮融资,降低解决硬件问题所需的成本 自动化技术支持工具开发商Mavenoid完成3000万美元B轮融资,降低解决硬件问题所需的成本

Mavenoid采用了技术人员协助的视频交互支持功能和人工智能引导的自助服务功能

快资讯2022-09-01

谷医堂又获美誉,谷医堂志在“百年企业” 谷医堂又获美誉,谷医堂志在“百年企业”

湖南谷医堂屡屡获得行业各类奖项,最近再次收获行业美誉谷医堂自成立至今,

快资讯2022-09-01

服务不停摆 孚惠教育暖心行动应“战疫” 服务不停摆 孚惠教育暖心行动应“战疫”

在疫情的影响下,很多地方仍没有复工,作为一家有社会责任感,有温度的爱心企业

快资讯2022-09-01