人民网
人民网>>IT

搜狗携旗下九大AI技术产品亮相智博会

2018年08月24日13:00 | 来源:人民网-IT频道
小字号

8月23日-8月25日,以“智能化:为经济赋能,为生活添彩”为主题的首届中国国际智能产业博览会在重庆举行,包括谷歌、微软、英特尔、腾讯、搜狗等500余家全球企业纷纷亮相,展示全球大数据智能化领域新产品、新技术、新业态和新模式。

在智博会现场,搜狗首次全面展示多领域、九大AI科技成果。

AI换脸术? 人脸迁移让人人都能七十二变

在搜狗“人脸迁移”体验区,观众只要选择自己喜欢的明星,镜头便会捕捉观众的人脸并与明星脸进行融合,生成专属观众的“明星脸”。

据了解,搜狗人脸迁移技术结合了人脸识别、三维人脸拟合、表情控制等多项前沿技术,能瞬间完成“换脸”体验,并可实现面部实时动态变化效果,跟随用户的脸部动作,完成多种表情、口型的变化。未来,该项技术还可以运用在直播、视频互动、影视制作以及教育等丰富场景中。

AI读唇术让科幻片场景成现实

除了人脸迁移技术,唇语识别技术体验区也是搜狗展台的一大热门。唇语识别技术是一项集机器视觉与自然语言处理于一体的前沿技术。

现场观众只需对着大屏幕默声说出一句话,如古诗“长风破浪会有时,直挂云帆济沧海”,无需发出声音,机器就能通过面部识别和唇型特征读出对应的发音,识别其说话内容,并生成文字呈现于大屏幕。这一互动,让在场观众亲身体验了一把“不发声,只动嘴,就知道你在说什么”的技能。

“说”“唱”俱佳 AI语音合成再升级

随着如今语音技术的逐渐成熟,语音合成技术已较为常见,但这次的智博会上,搜狗却带来了高定版的个性化语音合成。搜狗语音合成技术通过少量数据即可生成该说话者的合成音色,现场观众可以体验到由几近真人的AI合成声音,如合成搜狗CEO王小川的声音来播报消息以及演唱歌曲。

值得一提的是,搜狗目前已实现语音风格迁移。现场选择王小川的音色后,再匹配歌曲《蓝精灵之歌》,通过风格迁移技术,最终能生成王小川版《蓝精灵之歌》。这版歌曲中既包含了歌曲的曲调和节奏,也融入了王小川的声线及语言风格,生动有趣地呈现了搜狗语音合成和风格迁移技术。

据了解,搜狗基于深度神经网络的新一代合成引擎,目前已支持中英文、男女等二十多个音色的合成,而搜狗个性化语音合成技术仅使用个人10分钟左右的语音数据,即可训练生成具有该说话人特色的音色。

两大AI翻译硬件亲测 网红出国必备神器

硬件方面,搜狗今年大热的两大AI翻译硬件——能支持42种语言互译的“搜狗旅行翻译宝”和33种语言对话翻译的“搜狗录音翻译笔”,也亮相本次智博会。

据介绍,当前,搜狗语音识别准确率已高达98%,依托该技术,即使是夹杂着各地口音的绕口令这种高难度语音,搜狗智能语音识别技术都能准确将其转化为文字。同时,对于技术无法达到的最后2%的准确率,搜狗通过自然语言交互的形式修改所输入的文字,为用户提供了解放双手的智能输入体验。

搜狗表示,未来还将持续发力人工智能,在提升技术水平的同时,逐步渗透行业上下游,“软硬结合”,持续推动中国智能产业发展,连接智能生活。 (易潇)

(责编:易潇、杨波)

分享让更多人看到

返回顶部