参天生长大模型：昇腾AI如何强壮模型开发与创新之根？

2022-08-31 12:13来源：未知编辑：admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

自2018年谷歌发布BERT以来，预训练大模型经过几年的发展，以强大的算法效果，席卷了以NLP为代表的各大AI榜单与测试数据集。2020年OpenAI发布的NLP大模型GPT-3，实现了千亿级参数。BERT、GPT的强大能力成为AI领域里程碑式的存在，大模型的显著优势，也让产业界巨头与机构纷纷参与其中。

大模型优秀的泛化能力、通用AI的能力、高精度、覆盖多业务场景等优势，降低了AI开发与应用的门槛，也让“炼大模型”也成为AI产业的潮流。但有了算力、有了大模型，AI产业创新与落地应用就无忧无虑了吗？答案并没有这么简单，很多产业需求是无法用通用模型来处理的，技术理论与应用场景之间仍然存在着代沟；一些超大规模模型在部署时也会面临一系列问题，如算力、调参难度、硬件兼容性等。

如何让大模型走出实验室，走向产业，推动行业的创新，成为横亘在AI厂商面前的难题。那么，大模型该如何完成自身的进化，去适配使用场景、进一步推动AI产业的发展呢？在这方面，华为有一些方法与路径值得借鉴与思考。

从刷分转向全面可用

预训练大模型是AI持续变革的动力与核心发展方向之一，随着AI不断深入产业与各学科领域的过程中，科研院所及各大企业间开始了大模型军备battle，模型的类型朝着多样化、参数规模朝着极致化的方向发展。

百家争鸣中，我们看到模型参数规模越来越大，数据集纪录不断被刷新。但在真正的产业空间里，却很难看到大模型规模化的应用。拼模型参数，拼下游任务打榜成绩，是厂商推出大模型后标榜实力的惯常操作。然而到拼落地应用的时候，许多厂商的大模型却缄默了。

从高分到高能，大模型距离现实中的产业场景还有不短的路程要走。让大模型从“刷分”走向千行百业，需要一场全面的转型。

为了更好地推动大模型的发展，华为推出了人工智能大模型全流程使能体系，该体系包含从大模型规划、开发到产业化全流程，加速大模型产业化进程。

在产业界基于昇腾AI先后推出鹏程.盘古、鹏程.神农、紫东.太初、武汉.LuoJia、华为云盘古系列等有影响力的大模型后，为进一步鼓励大模型的研究与创新，华为推出了昇腾科研创新使能计划，通过资金、算力、技术和社区的扶持，鼓励高校及科研院所基于昇腾大模型沙盘，开展大模型的研究和创新，在前沿领域和热点行业打造出世界级领先的大模型。

99科技网：http://www.99it.com.cn

共4页: