人民網
人民網>>IT

聽得懂話 聊得來天 幫得上忙

智能音箱到底有多“能”?

本報記者 汪靈犀
2018年06月20日08:10 | 來源:人民網-人民日報海外版
小字號

  “智聯網養老院”讓老人用上人工智能音箱。
  許康平攝(人民圖片)

  風靡全球

  率先扎進智能音箱領域的亞馬遜可能沒有想到,它的一次嘗試居然讓這個行業在4年后影響了全世界。從2018年第一季度全球智能音箱920萬個的出貨數據上就能看出,越來越多的智能音箱產品正在走進人們的日常生活。如今,依托互聯網技術的服務能力,智能音箱已經擁有涵蓋影音娛樂、新聞資訊、購物外賣、家居控制、生活助手、兒童教育等領域的100多項技能。

  全球的互聯網大佬都在追逐這一潮流,連一向“高冷”的美國蘋果公司今年初也推出了內置人工智能語音助手的智能音箱。“我們認為,客戶將被它的音頻質量震驚。”蘋果公司全球營銷高級副總裁菲利普·席勒對自家產品充滿自信。

  亞馬遜和谷歌兩家公司則更早布局市場。亞馬遜於2014年推出的智能音箱目前已經售出數千萬台,在智能音箱市場處於領先位置。谷歌的智能音箱於2016年在年度開發者大會上推出,一直是該公司深受歡迎的產品之一,佔據智能音箱市場第二的位置。

  在中國市場,智能音箱行業同樣引領潮流,互聯網企業忙著搶佔風口:百度推出“小度”,騰訊推出“聽聽”,京東推出“叮咚”,小米推出“小愛同學”……市場反應積極熱烈,在1月24日的天貓年貨節首日,開場1小時,智能音箱“天貓精靈”就賣出近3萬台。

  彎道超車

  智能音箱風靡的背后,是智能語音識別和機器學習技術的快速發展,這兩個技術,一個讓音箱“聽得見,說得出”,一個讓音箱“聽得懂”。而這一次,中國的企業沒有掉隊。

  科大訊飛是中國智能語音識別領域的王牌企業。在日前於貴陽舉行的“2018中國國際大數據產業博覽會”上,科大訊飛展出了一系列新產品,包括智能客服、曉曼智能音箱、曉譯人工智能助理等。據工作人員介紹,這是當前人工智能領域的語音識別、語音合成、自然語言理解等技術的綜合應用。“我們最新推出的訊飛翻譯機2.0,能支持中文與33種語言互譯,粵語、四川話等方言也都能翻譯成外語。”

  語音識別解決了“主人說的話是什麼內容”的問題,機器學習解決的則是“主人說的話是什麼意思,我該怎麼響應”的問題。通過“吃進去”大量數據,智能音箱逐漸學會把用戶指令和相應操作一一對應起來。說“播放新聞”就打開新聞客戶端,說“播放音樂”就打開音樂播放器。伴隨著與用戶的持續互動,智能音箱還能不斷進化成長,實現“千人千面”,能夠根據每個人的喜好進行內容設定和推薦。

  智能音箱也能成為智能家居“指揮部”。通過聲紋識別技術,智能音箱能“認識”主人,分辨出陌生人的聲音,主人隻需對智能音箱發號施令,不用伸手、不出房間,就能遙控位於家中各處的門窗、電燈、空調或熱水器。

  “中國在這次科技浪潮上是趕在前面的,深度學習有超過40%的論文是華人發表的。我們有很好的數據、巨大的樣本群,有很好的工程師隊伍,又有全球一流的制造能力。”獵豹移動創始人兼首席執行官傅盛表示:“未來是人與機器人共存的時代,中國存在彎道超車的機會。”

  服務生活

  目前,市面上大多數智能音箱產品的用戶體驗都有很大改善空間,在語音交互、語義理解等方面還不夠“智能”,這也是很多廠商現階段的攻堅重點。小米“小愛”團隊採用的是交互式學習的算法,其總監王剛博士表示:“剛開始小愛也沒有這麼聰明,很多東西聽不懂,但與用戶的交流會讓它越來越聰明,更多的用戶數據會讓小愛自己學習理解以前聽不懂的問題。”

  智能音箱只是一種形式,實際上語音交互才是最核心的突破。“其實我們推動產品落地有很多種方式,智能音箱只是其中的一個。讓語音交互與別的形式結合,也有可能。”阿裡人工智能實驗室相關負責人表示。

  不管是什麼形式,服務人類生活是最根本的目的。“人工智能技術的不斷發展必將不斷重塑各行各業以及改變我們的生活。”微軟亞洲研究院副院長張益肇將這種“重塑”概括為3個方面:推動產業向智能化轉變、引發商業創新、讓人們的生活更美好。

  南京工業大學碩士研究生宋昊旻的故事正印証著這一點。宋昊旻在1歲時失去聽力,被診斷為終身聽力嚴重損傷。在上月舉行的微軟人工智能大會上,他體驗了一款語音服務設備,這款設備能夠把宋昊旻努力發出的聲音以極高准確度轉換成文字,還能同步翻譯成英語或其他語種,真正實現無障礙溝通。語音交互技術或將改變他接下來的人生。

  這就是技術變革給人類帶來的福音。

(責編:孟哲、沈光倩)

分享讓更多人看到

返回頂部