主页 > 互联网+ > 正文

百度大脑公布语音能力日均调用量已超100亿次

2019-11-30 11:36来源:99科技综合编辑:时寒峰

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

  原标题:百度大脑公布语音能力日均调用量已超100亿次

  11月28日,百度大脑语音能力引擎论坛在京召开,百度大脑公布语音能力日均调用量已超100亿次。百度语音首席架构师贾磊全面介绍了百度语音核心技术能力,其中,AI虚拟主持人一开口就赢得不少参会者的惊叹。

  温柔甜美的语音、精细自然的唇动,加上播报过程中不时点头、眨眼等细微表情,虚拟主持人灵动的神态堪比真人主播的新闻播报。“真是太自然了!很好奇这是怎么做到的。”在场嘉宾表示。

  除了此次论坛上的惊艳亮相外,百度大脑AI虚拟主持人们也屡登大舞台,展现出“职业级”素质。在今年的五四晚会上,百度大脑AI虚拟主持人小灵元气登场,成为王俊凯口中本场最年轻的一位主持人。3D虚拟主持人小灵全程妙语连珠、还用人脸识别技术帮嘉宾测试“你是什么花?”、借由AR能力穿越到观众手机中实时互动,圈粉无数。除了小灵外,小菲也表现出色,现在她已经在百度与澎湃联合打造的,全球首档真人形象虚拟主播早晚新闻栏目中上线120天了!每天准点为大家带来专业的早晚新闻播报。

  无论是3D人物小灵或是2D真人形象的小菲,她们背后都糅合了百度大脑领先的语音合成、唇动合成、肢体合成、视频合成等一系列多模态AI技术,呈现出灵动逼真的虚拟主播形象。

  而作为主持人最为重要的基本功,其优秀的“口条”主要是语音技术与唇动合成技术在支撑。现场,贾磊介绍了百度语音合成与唇动合成联合技术的内核。据悉,百度研发了一套语音到唇形的回归技术,探索了唇形轮廓的匹配策略,最终用计算机图形学进行了高精度的纹理和合成匹配,唇动准确率可以达到98.12%。用户只需输入音频即可直接生成唇形动画,最快可以实现1倍实时以内的视频生成。这意味着10分钟的新闻视频仅需要10分钟即可完成生成!并支持7x24小时的在线服务。

99科技网:http://www.99it.com.cn

相关推荐