主页 > 快资讯 > 正文

没有这些,别妄谈做ChatGPT了

2023-03-01 09:31来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

ChatGPT破圈爆火后,越来越多人开始问:

“啥时候出现中国版的ChatGPT?”

国内学术界和工业界,都纷纷躁动起来——百度、阿里、字节等大厂纷纷喊口号,一众创业公司也开始争做中国版OpenAI;学术界也在用行动来表明战斗力,比如前些天复旦大学推出的MOSS模型,一经开放试用,便冲上热搜。

一时间眼花缭乱,让人生疑。

有钱就能训出模型?

以美团大佬带资入组为代表,很多创业者和投资人盯上了ChatGPT,作为一个NPLer,我乐见其成,相信不用几个月,在热钱的助推下,NLP算法工程师的薪资要和芯片看齐了。

但我还是要泼个冷水,创业公司想做ChatGPT,想训练模型,不是有钱招几个算法就能搞定的。

先不说ChatGPT,只说较为成熟、参数量“较小”的BERT模型,其 Large版本参数量“仅有”3.4亿,比现在的ChatGPT模型足足小了3个数量级。但如果一个从业者真正从0开始训练过BERT模型,那他一定不会认为训练BERT这个“小模型”是很容易的事情。

更何况,2018年BERT发布的时候,模型参数、训练代码是全面开源的,训练数据BookCorpus和Wikipedia也非常容易获取。在这种情况下,国内各大厂训练出内部版本的BERT模型,也经历了差不多半年的摸索时间。在此期间,算力就位、训练精度优化、训练性能优化、底层框架支持、训练策略优化、数据策略优化等都有不少的坑要趟。

如今ChatGPT既没有公开代码,也没有公开训练数据,更没有公开模型参数,甚至都没有公开前置模型的模型参数,模型的体量还比BERT大了3个数量级。

ChatGPT没有捷径

相对创业团队,中国的互联网大厂在大模型方向有积累,有先发优势,但这绝不意味着高枕无忧。

在语言模型方面,国内各大厂大多沿着“以掩码语言模型MLM为核心的BERT路线”进行深耕,这种技术路线更加注重提升语言模型的文本理解能力,弱化文本生成能力。真正沿着ChatGPT这种生成式语言模型的路线深耕的研究团队,无论国内外,都不是太多。

这就注定了,ChatGPT的复现不是一朝一夕就能完成的,补功课很可能要从三年前OpenAI发布的GPT-3开始。如果没有GPT-3提供的世界知识和强大的长文本生成能力,训练ChatGPT就无异于建造空中楼阁了。

可惜,GPT-3至今也没有开源,未来也大概率不会开源了。要从头训这么一个1750亿参数的大型生成式语言模型,难度非常大。

99科技网:http://www.99it.com.cn

相关推荐
AI文章挤爆投稿邮箱!刊龄17年杂志被迫暂停征稿,“这些人就是为赚快钱” AI文章挤爆投稿邮箱!刊龄17年杂志被迫暂停征稿,“这些人就是为赚快钱”

ChatGPT大火,却把知名科幻杂志气到“掀桌子”了。

快资讯2023-02-23

球探即时比分:拉比奥:尤文没有主力替补之分;客战里昂会很困难 球探即时比分:拉比奥:尤文没有主力替补之分;客战里昂会很困难

在尤文图斯主场2-0击败布雷西亚之后,拉比奥在接受采访时强调,他们可以进一

快资讯2022-11-21

C盘清理瘦身扩容搬家没有效果?磨针一键永久解决C盘问题 C盘清理瘦身扩容搬家没有效果?磨针一键永久解决C盘问题

您在使用windows的过程中是否经常碰到以下问题: 1、C管不管多大,总会变红、

快资讯2022-11-08

Hinton、Yann LeCun、李飞飞谈深度学习十年:AI没有走入死胡同,“革命”仍如火如荼 Hinton、Yann LeCun、李飞飞谈深度学习十年:AI没有走入死胡同,“革命”仍如火如荼

Geoffrey Hinton是十年前深度学习初创“革命”的开拓者之一。他看来,未来 AI 技

快资讯2022-09-21

AI没有“无人区” AI没有“无人区”

人工智障和AI艺术家的差距,更多是人工智能中“人”的差距。

快资讯2022-09-21

为何能让年轻女性一见倾心 以内X3扫地机器人做到了这些 为何能让年轻女性一见倾心 以内X3扫地机器人做到了这些

快节奏的城市中,大多数女性压力大、工作忙,没有太多时间花在家务上。为减

快资讯2022-09-06

AI企业上市困局:秀肌肉时代已远去,还是没有新故事 AI企业上市困局:秀肌肉时代已远去,还是没有新故事

AI企业“上市潮”已然来临,但遗憾的是,资本市场似乎已容不下“烧钱大户”

快资讯2022-08-30

非科班AI小哥火了:他没有ML学位,却拿到DeepMind的offer 非科班AI小哥火了:他没有ML学位,却拿到DeepMind的offer

这两天,DeepMind研究工程师小哥Aleksa Gordić的个人经验贴在Twitter上火了一把。

快资讯2022-08-30

百度计算机视觉首席科学家王井东:在视觉的竞技场,研究与落地没有明显的界限 百度计算机视觉首席科学家王井东:在视觉的竞技场,研究与落地没有明显的界限

在王井东看来,百度搜索引擎、自动驾驶、智能云、小度等等不同的业务线中,

快资讯2022-08-28

iPhone14全家福图片曝光,没有mini版 iPhone14全家福图片曝光,没有mini版

近日,iPhone14突然登上热搜。一海外爆料达人晒出了该机全系四款新机的“全家

快资讯2022-08-13