主页 > 元宇宙 > 正文

参天生长大模型:昇腾AI如何强壮模型开发与创新之根?

2022-08-31 12:13来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

自2018年谷歌发布BERT以来,预训练大模型经过几年的发展,以强大的算法效果,席卷了以NLP为代表的各大AI榜单与测试数据集。2020年OpenAI发布的NLP大模型GPT-3,实现了千亿级参数。BERT、GPT的强大能力成为AI领域里程碑式的存在,大模型的显著优势,也让产业界巨头与机构纷纷参与其中。

大模型优秀的泛化能力、通用AI的能力、高精度、覆盖多业务场景等优势,降低了AI开发与应用的门槛,也让“炼大模型”也成为AI产业的潮流。但有了算力、有了大模型,AI产业创新与落地应用就无忧无虑了吗?答案并没有这么简单,很多产业需求是无法用通用模型来处理的,技术理论与应用场景之间仍然存在着代沟;一些超大规模模型在部署时也会面临一系列问题,如算力、调参难度、硬件兼容性等。

如何让大模型走出实验室,走向产业,推动行业的创新,成为横亘在AI厂商面前的难题。那么,大模型该如何完成自身的进化,去适配使用场景、进一步推动AI产业的发展呢?在这方面,华为有一些方法与路径值得借鉴与思考。

从刷分转向全面可用

预训练大模型是AI持续变革的动力与核心发展方向之一,随着AI不断深入产业与各学科领域的过程中,科研院所及各大企业间开始了大模型军备battle,模型的类型朝着多样化、参数规模朝着极致化的方向发展。

百家争鸣中,我们看到模型参数规模越来越大,数据集纪录不断被刷新。但在真正的产业空间里,却很难看到大模型规模化的应用。拼模型参数,拼下游任务打榜成绩,是厂商推出大模型后标榜实力的惯常操作。然而到拼落地应用的时候,许多厂商的大模型却缄默了。

从高分到高能,大模型距离现实中的产业场景还有不短的路程要走。让大模型从“刷分”走向千行百业,需要一场全面的转型。

为了更好地推动大模型的发展,华为推出了人工智能大模型全流程使能体系,该体系包含从大模型规划、开发到产业化全流程,加速大模型产业化进程。

在产业界基于昇腾AI先后推出鹏程.盘古、鹏程.神农、紫东.太初、武汉.LuoJia、华为云盘古系列等有影响力的大模型后,为进一步鼓励大模型的研究与创新,华为推出了昇腾科研创新使能计划,通过资金、算力、技术和社区的扶持,鼓励高校及科研院所基于昇腾大模型沙盘,开展大模型的研究和创新,在前沿领域和热点行业打造出世界级领先的大模型。

99科技网:http://www.99it.com.cn

相关推荐