虚拟主播“果果”面世记

——走近人民日报社首位AI虚拟主播

叶晓楠  史静远  杨  洁

2019年07月26日08:31  来源:人民网-人民日报海外版
 

  AI虚拟主播“果果”

  “果果”的原型、人民日报社主持人果欣禹

  “读者朋友们,早安!今天是2019年6月20日,星期四。人民智播报虚拟播报员果果为您播报!”最近,在“人民智播报”微信公号上,每天早上7时,人民日报AI(人工智能)虚拟主播“果果”都准时“上岗”,流利地向观众播报国内外热点事件。

  AI虚拟主播近年来一直广受关注。通过采集真人主播的声音和图像并使用人工智能技术合成制作出的虚拟主播,仅需输入文字版新闻,就可以自动生成多语种语音和配套表情,合成新闻播报视频。

  从央视以主持人康辉为原型制作的“康晓辉”,到人民日报数字传播与科大讯飞共同打造的虚拟女主播“果果”,越来越多人工智能走上新闻播报台,在融媒体时代下利用前沿科技生产优质内容,使新闻播报既快速又准确,还能带给观众新奇的观看体验。

  虚拟主播是如何诞生的?虚拟主播的日常生活又是怎样进行的?近日,本报探访了人民日报社首位虚拟主播“果果”和她背后的团队,听他们讲述“果果”的故事。

  实现多语言播报

  “大家好,我是人民日报AI虚拟主播果果!”今年5月25日,在贵州省贵阳市举办的2019国际大数据产业博览会上,一位特殊主播的亮相“引燃”全场。身穿鲜艳的红色西装、面带端庄大气的微笑,屏幕上的“果果”清晰流利地用普通话、广东话、英语和多种其他语言向在场观众进行播报示范。“感觉科技太厉害了,大家都在情不自禁地鼓掌。”回忆起当天现场的状况,“果果”的原型、人民日报社主持人果欣禹激动地说。

  6月的一个下午,笔者在人民日报社的演播厅外见到了果欣禹。“我是人民日报第一个与AI技术结合的人,想想还挺神奇的。”提到参与制作虚拟主播时的种种细节,她自己也觉得很新鲜。

  果欣禹告诉笔者,科大讯飞的技术人员利用一上午的时间,采集了她几个小时的人像、音频素材,她坦言,“还挺累的,过半个小时就要歇一下。”她回忆道。

  录制当天,她先后穿了红色、蓝色两套西装。为了方便后期“果果”人像的生成,头发还得梳得一丝不乱。果欣禹还说,那天读的稿子不同寻常,类似于“今天”“鸟”“树叶”“绿”等各种类型的文本。“当时读的时候还觉得很复杂,但是技术老师让我保持主播播报状态,读对读准。”

  等到“果果”正式亮相后,果欣禹的家人和朋友都觉得很像她。“不过她没有我标志性的大笑,比我端庄多了。” 果欣禹调侃说。

  这一有趣的体验背后,有着科大讯飞的多个技术“法宝”加持。科大讯飞项目经理邵俞鹏接受本报采访时介绍说,多语种虚拟主播的制作利用了讯飞的语音合成、人脸识别、人脸建模、图像合成、机器翻译等多项人工智能技术。目前,虚拟主播可以实现多语言的新闻自动播报,且支持文本到视频的自动输出,便捷地实现了从文本到视频的转换。

  除了人民日报外,在过去的一年多里,央视也不断地推出虚拟主播,它们中很多都是基于家喻户晓的“熟脸”进行制作的。

  2018年5月2日,央视虚拟主持人“康晓辉”亮相屏幕,与央视记者江凯共同主持《直播长江》安徽篇。“粉红墙上画凤凰,凤凰画在粉红墙。”节目期间,“康晓辉”还用康辉老师的声音说了这样一段轻快的绕口令,向观众展示了自己高超的“专业实力”。

  据了解,虚拟主持人“康晓辉”的外型复制央视主持人康辉,通过相芯科技的虚拟形象生成技术创建,并通过虚拟形象驱动技术实现。声音则是通过科大讯飞旗下的讯飞智声平台的AI语音合成技术对康辉声音进行合成模拟而成的。

  是一款文化产品

  人民日报数字传播董事长徐涛对笔者说,“‘果果’不是一个噱头,我们希望它是一个能够真正用得上的文化产品。”

  徐涛向我们展示了“果果”日常是如何“工作”的:只见他在控制系统中输入了一篇新闻稿,5分钟后,一段“果果”的新闻播报视频就由人工智能系统自动生成了。徐涛介绍说,“果果”的运营团队每晚将当天的新闻事件集萃文稿用这种方式生成5分钟左右的视频,并在微信公众平台定时发送,让“果果”能每天准时和观众见面。

  不仅在新闻节目中,虚拟主播也“走”上了网络春晚的舞台。在2019年的网络春晚中,央视主持人朱迅、高博、龙洋、撒贝宁的孪生人工智能主持人“朱小迅”、“高小博”、“龙小洋”和“小小撒”一一亮相。节目串场中,当名嘴撒贝宁掏出台本,准备宣布下一环节时,“小小撒”抢先一步,说出了台词,惹得一旁撒贝宁开玩笑地问,“能让我说一句吗?”

  场景将更多元

  5月25日,果欣禹在贵阳国际大数据产业博览会上和观众一同见证了“果果”的“诞生”。她告诉笔者,之前见到的预演的“果果”声音和画面还没有完全对位,因此她当时特别紧张,手心都是汗。而当“果果”顺利亮相、并能用多国语言自信地播报新闻时,果欣禹感慨道,她仿佛看到了一个优秀版的自己。

  “现在常常有人在外面认出我,看来我的‘同胞妹妹’比较出名。”不过,她也承认,现在的“果果”仍然有表情不够丰富、声音缺乏感情等问题,“希望随着技术革新,她能越来越好,说不定有一天,我们俩能一块主持节目。”

  而徐涛并不满足于此,他告诉笔者,未来的“果果”不仅要更加逼真,还要有更多的突破。“现在是第一代,以后我们还要打造站立播报新闻的虚拟主播形象,会有更多手势和动作。”

  在徐涛看来,5G时代的来临让研发虚拟主播变得十分必要,“我们实际上在为全国的新闻行业提供一个能够增强生产效率的工具。”他解释说,在5G时代,随着网络运行速度的大大提升,信息高速公路越来越宽,因此需要更多的优质内容。人工智能技术的运用节省了视频新闻制作所需的时间和成本,将极大地助力未来新闻行业的内容生产。

  徐涛展望,“在未来,虚拟主播的使用场景将更多元化,在地铁、机场等公共设施上的视频信息播报中,也可能会有越来越多虚拟主播的身影。”

(责编:赵爽、毕磊)