人民网
人民网>>IT

微软帮领航AI创业潮

2018年12月19日08:10 | 来源:中国网
小字号
原标题:微软帮领航AI创业潮

   2017、2018年两年,资本寒冬论甚嚣尘上,但如果留意近两年的融资创业数据,会发现资本并非在过冬,而是嗅觉灵敏的他们开始从移动互联网转移向新的风口:人工智能。

   北京市经信委在六月底发布的人工智能产业发展白皮书显示,截至2018年5月8日,全国人工智能企业共4040家,拿过风险投资的人工智能公司合计1237家。在北京,A轮以前的初创企业占比高达56.97%,在2015年-2016年爆发式增长。

   2017年正是人工智能公司收获资本青睐的起点:

   创立于2014年的商汤科技在2017年和2018年先后三轮融资,其中2018年的C轮和C轮+间隔不到一个半月;创立于2016年的一览群智也在2018年11月21日完成了1.5亿元的A轮融资。

   一代企业有一代企业的使命,而时代的更迭也会催生顺应时代的巨头。新一轮AI创业潮实质就是基于大数据与算力的机器学习与应用,商汤科技和一览群智这样的AI公司也就承载着它们在这个时代的使命:站在巨人前辈的肩膀上,做AI与企业生产力对接的桥梁。

   同源微软,各表一枝

   对业内人士而言,微软,或者说微软亚洲研究院才是国内新一波AI浪潮的招牌。商汤科技创始人汤晓鸥曾在微软亚洲研究院从事计算机视觉领域的工作;而一览群智首席科学家文继荣先生系微软亚洲研究院元老、曾任Bing核心架构师,CEO胡健、CTO窦志成职业生涯的起点也来自微软亚洲研究院,从某种意义上,他们都算“微软帮”。

   在过去20年,微软亚洲研究院有115位院友创业,18位院友在互联网企业中担任CEO或CTO,遍布老中青三代,在外企中,这是一项前无古人的成就。

   与谷歌研究院注重产品导向的研究风格不同,微软亚洲研究院更聚焦在计算机软件、算法方面的基础研究,但这些研究往往有着明显的应用场景,这又区别于IBM研究院较为天马行空的风格。微软在基础研究上的突破与积累更多是在一个一个脚踏实地解决计算机科学中的实际问题,比如计算机图形图像领域,在2005年的论文数量占据了SIGGRAPH论文总数10%,而在搜索领域,也曾保持着SIGIR大会收录论文数量超过10%的骄人成绩。这些技术进步带来了搜索引擎的一次次重构及体验改善,带来了人脸识别从百分之八十几的准确率到百分之99小数点后还有几个9。当一项基础技术成熟到准确率接近100%的时候,也就打开了无数商业应用的可能。

   这也是为何今日AI领域的领先公司在技术上有浓厚微软烙印的原因:商汤科技的立足点在于包括人脸识别在内的计算机视觉技术,一览群智在以知识图谱和自然语言处理为核心的认知智能技术领先,他们在技术领域内各自卡位,同时因地制宜,和中国的商业实践对接。

   从技术中来,到场景里去

   AI公司在竞争中有两个核心问题:第一是如何进行技术定位。

   当下的人工智能应用在本质上算是“弱人工智能”应用。商汤科技定位在识感知智能,技术和产品已经相对成熟,所以公司能够爆发式融资;而一览群智卡位的认知智能,在技术上的挑战更大。

   一览群智CEO胡健做了个比喻:假设有一根横轴,横轴左边的坐标是人类独立决策,右边的坐标是机器决策,AI的发展实际上是从左向右移动的过程,从计算智能、感知智能、认知智能到创造智能,难度依次递进。

   一览群智技术合伙人刘家俊解释:当下人工智能强烈依赖“机器学习”技术,尤其是有监督学习,其本质其实就是人类通过样本数据训练机器来学习人类的判断逻辑。目前,自然语言处理比图像识别的难度更高:图片是一种原始、具象、充分冗余的信号,但文本却是一种高度抽象、简约的信息。一个“词语”本身就具有多重释义,同时结合不同的语序、语境等条件又能衍生出多重意思,而语音语调等原本重要的附加信息在文本中也不复存在。一张图片遮掉一半,人还能知道这是一匹马;一句话挡住一个字,意思可能完全不一样。要让机器不“误判”,就要进行大量的针对性设计,不光将文字本身,更要将语境、常识等信息引入到AI模型之中,才有可能让AI更好的学习人类对文字的处理逻辑。

   虽然AI远没有达到比肩人类的学习与类比能力,但弱AI已经能在很多地方极大提升生产力。在这种情况下,清楚AI的边界,充分理解行业,谨慎选择能够发挥AI最大价值的应用场景,成了AI业务成功的关键。这就引出了AI竞争的第二个核心问题:如何找到具体行业的里具体场景。

   企业不但要做技术卡位,也要做商业定位。如商汤科技,如果梳理商汤创业四年来的融资轨迹,会发现90%以上的融资额都是在近两年完成,公司在创业初期因为找不到给计算机视觉落地的场景,一度非常艰难。而到了2017年和2018年,相关的应用越来越多,比如在手机业的黑科技军备竞赛中,人脸解锁已经成为旗舰机的基本配置,这就让企业在人脸识别的积累上有了秀肌肉的机会。

   在难度更大的自然语言处理上,一览群智自然更小心翼翼。胡健回忆:“在2016年正式创立前,我们几乎是非常小心地,用了长时间讨论我们究竟能干什么。”最终,一览群智开辟了“场景+认知智能”的新赛道,“场景”的位置甚至要在技术前。一群崇尚技术的理工男,却并不迷信技术:由于深知技术的局限性,由于看到了技术和商业之间的鸿沟,在业务上显得特别接地气。

   刘家俊解释:理性的看这波AI浪潮,很多人鼓吹的单靠一两个算法要颠覆一个业务场景的愿景是不切实际的。只有充分理解原有业务流程与业务需求,在关键的节点上配合算法上的突破,才能真正为客户提供一条用AI进行业务升级的可行道路。而要让机器能理解客户的场景、理解文本所代表的“知识”,就要构建它的知识图谱。而以目前的技术阶段而言,通用型的知识图谱并不切实际,甚至行业性的知识图谱也过于宽泛。

   籍此,一览群智的客户虽然涵盖政府、金融、电商等常人眼中的“高大上”领域,但设计的解决方案却几乎都是针对具体场景的量体裁衣:

   如在电商领域的一个场景是分析社交话题与电商产品热销度的关联,以提升商品与热点的匹配度,最终促进销量。以此为切口,一览群智与电商巨头合作,为电商平台与品牌商提供了一整套感知产品销售维度的解决方案,最终实现的不限于“促销”,甚至能够反向指导品牌方整体的产销存策略。

   再如金融机构的国际结算业务,在过去,金融机构需要雇佣大量的人力做审单工作,机构成本居高不下不说,也是对人才与人类创造力的浪费。一览群智的国际结算自动审单解决方案,实际上就是从这类场景中“推导”出来的。

   就因为有着极其深厚的技术背景,又想明白了场景的重要性,这让一览群智虽然来得不够早(2016年),却不能说是赶了晚集。这群懂商业的AI技术人,在短短两年时间里已经展现出不同寻常的爆发力。

   商业模式的同与异

   新一轮AI潮其实也是产业互联网的大潮,对投身B端赋能的企业来说,除本身要具有业界领先的技术能力外,还要具备两个基本特质:第一,有通用的技术平台;第二,拥有从场景出发的行业定制服务能力。而一览群智和商汤这类技术服务商的共同点是:技术聚焦,客户聚焦,能够一体化地提供技术与产品的落地解决方案。

   比如商汤科技有一个著名的“1+1+X”理论,第一个“1”代表研发,第二个“1”代表技术产业化,X代表赋能多家合作伙伴。联合创始人杨帆解释该逻辑:进入某垂直领域,先找头部公司,让AI技术落地,再打通行业生态,比如在安防领域,最终是要打通前端摄像头、后端云平台甚至芯片的整个链条。

   一览群智和商汤科技的商业模式有所不同,其凭借“览聚数据融合平台”、“览智AI平台”、“览析数据多维分析平台”等基础产品,形成了金融监管、全息搜索、公共安全、媒体情报等解决方案,进步之处在于,基础产品下还有一层底层AI技术平台,而在前端还有来自不同行业的顶级专家,如金融合伙人冯海涛曾任埃森哲咨询公司金融行业董事总经理、IBM全球服务业务部金融行业合伙人,最终实现了AI落地的公式:场景+认知智能=生产力。

(责编:易潇、杨波)

分享让更多人看到

返回顶部