人民網
人民網>>IT

視覺AI為傳統產業裝上“智慧之眼”

郜小平
2018年12月27日08:08 | 來源:南方日報
小字號
原標題:視覺AI為傳統產業裝上“智慧之眼”

  12月22日,素有“逃犯克星”稱號的張學友在江門市舉辦演唱會,不出意外,又有一名在逃人員在演唱會上落網。據不完全統計,今年在張學友演唱會被抓捕的在逃人員約25名,其他犯罪嫌疑人約68名。

  這背后,是基於深度學習的人臉識別算法“立功”。人工智能(AI)不僅可以識人,還可以識物。在深圳碼隆科技展廳的無人售貨機,消費者掃碼打開櫃門、取出商品、關上櫃門,系統自動結算。相比傳統的自動售貨機,不再需要把商品“規規矩矩”擺列,消費者也不用隔著玻璃點擊購買。

  在計算機視覺領域,先后涌現出雲從、商湯、曠視、依圖、雲天勵飛等人工智能創業公司,它們從人臉圖像識別起步,進而在新零售、工業、芯片、智能終端等領域走出各自差異化道路,打開了廣闊的應用空間和發展前景。

  搶佔攝像頭入口城市大腦裝上“智慧之眼”

  在深圳,超過2萬民警使用的警務雲終端上,一款叫做雲天“深目”的動態人像App,經過一定的權限管理系統,民警們可以對犯罪嫌疑人在2秒內,檢索他從深圳的機場到地鐵,到南山、福田、羅湖、龍崗跨區域的活動軌跡,落地他的身份、查詢他的前科。

  這套系統在深圳上線后,就協助公安破獲了經偵、技偵、網警、打拐、緝私等等各類案件突破1萬多件,協助找到了上百名走失的兒童和老人。

  對很多人來說,安防監控並不陌生,但傳統的安防監控雖然實現了記錄功能,但不能准確識別視頻中的人、物和場景,民警往往需要花費大量的時間精力從海量的視頻監控中獲取到需要的信息。

  雲天勵飛依托“雲+端”人像智能解決方案,前端實現人臉檢測跟蹤、抓拍採集,后端引擎通過深度學習實現人像結構化特征值提取,結合人像識別應用平台實現動態、開放、多場景下的人像精准識別和布控。“以前20個民警看一個星期的視頻,現在隻需要幾秒鐘就可以完成。”雲天勵飛戰略規劃總監張旭媚說。

  而在張學友今年以來的演唱會中,就有廣州雲從科技、雲眼大視界等AI公司“立功”的身影。各大AI公司都在搶佔安防市場,而攝像頭正成為智慧城市的“入口”。張旭媚說,傳統攝像頭的安裝都希望架得高、輻射面積大,但現在更清晰的人臉採集攝像頭架設更低,在實際應用中,各家的算法不同,對攝像頭的調試、架設的角度、高度標准以及售后服務等都不一樣,一旦搶先布局了攝像頭,就有一定的排他性,未來短期內不太可能再重新架設一套攝像系統。

  盡管人臉識別站上了產業風口,但對實戰要求卻很高。記者了解到,在深圳舉行的高交會上,安檢門同時採用了2套系統,分別負責一個入口,結果其中一個系統崩潰了,因為實驗室拍照的樣本非常清晰,但實際中經常要側臉抓拍等方式,這和以前訓練的方式不一樣,時間一長系統承受不住了。

  從“刷臉”跨向“識人”AI與用戶互動還能幫助決策

  人臉識別系統不僅可以“刷臉”,還在朝著“認識人”邁進。2018年10月底,雲從科技宣布,在語音識別技術上取得重大突破,他們融合圖像識別與語音識別的優勢,推出全新Pyramidal-FSMN語音識別模型。

  在技術研究的“最后一公裡”,每0.1個百分點的進步都異常艱難。全新Pyramidal-FSMN語音識別模型在全球最大的開源語音識別數據集Librispeech上刷新了世界紀錄,准確率提升到97.03%,將Librispeech的錯詞率降低至2.97%,超過阿裡、百度、約翰霍普金斯大學等企業及高校,大幅刷新原先紀錄。

  讓外界有些不解的是,以人臉識別聞名的雲從科技,怎麼就切入到了語音市場。事實上,語音識別技術同樣是智能感知中一個重要的部分,通過語音識別,機器可以像人類一樣聽懂說話,進而能夠理解、思考與反饋。

  “雲從的技術圍繞人為主要方向,不僅僅是認識你的臉,還要認識你這個人﹔不僅在人臉識別上更快,而且能看出你的神態、步態、衣著。”雲從科技高級副總裁伍楚芸在接受南方日報記者專訪時說,如果單純在人臉識別上競爭,雖然一開始差距挺大,但最后只是99.8%和98.9%准確率的差異,這點差異在大部分應用場景上可以忽略,而雲從要做的是從感知、認知到決策的閉環,雲從進軍語音識別,從而更好地進行人機交互,“除了我認識你,還要與你語音互動,能聽懂你的意思,甚至還能幫助到你”。

  如今,用戶的需求也不僅僅局限於“美顏”,對人識別的要求還發展到了美體。商湯科技應用創新AI技術,將AR識別和繪制能力從“臉部”延伸至“全身”,在原創的SenseAR增強現實感繪制平台上,推出了全新功能模塊——SenseAR美體塑形,不僅可以針對頭、肩、腰、臀、腿等部位及身高比例進行調整,還可以輕鬆實現一鍵式全身美體塑形。

  從“識人”向“識物”邁進開拓一個智能識別的新興市場

  在碼隆科技的展示區裡有一個顯示屏,當用戶路過攝像頭前屏幕上就會出現此人所穿衣服的種類、顏色和風格﹔而在無人售貨機的改造上,一個簡易貨櫃架上一個普通攝像頭,1分鐘就可把普通貨櫃改造成智能貨櫃,而成本僅為此前貨櫃的一半。

  “識物”正在成為AI公司新藍海。今年12月,聯發科在深圳發布了主打AI性能的新一代Helio P90系統單芯片,在這款被稱之為“全球首款AI識物芯片”的背后,站著一眾人工智能視覺公司,包括商湯科技、曠視、碼隆科技等。

  碼隆科技嵌入Helio P90芯片的物體識別技術已經集成了針對服飾的識別,可以准確識別衣物的類別、款式、風格、元素等特征,將有力地支持Helio P90從本地端更好地服務於智能手機廠商以及視頻和圖像等應用領域。“從數量來說,包括商品在內的物品,要遠比人臉更多,想象空間也更大。”碼隆科技運營副總裁劉念說。

  商湯科技聯合創始人、副總裁楊帆也告訴南方日報記者,計算機視覺產業可以從圖片和視頻中提取的要素通常有人臉、人體、衣物、步態、車輛等,未來,圖片和視頻將成為最重要的信息載體,因為其涵蓋的有效信息量最多,而通過對這些信息的分析,也將誕生新興的科技巨頭公司。

  與傳統行業結合找差異化拓寬自身邊界

  雲從、商湯、依圖、曠視在計算機視覺行業,AI公司風起雲涌、攻城略地,在走過了最初安防領域的應用后,各大AI公司也在不斷拓寬自身的邊界。

  在行業縱深方面,如在銀行業,雲從科技已成為人臉識別應用的第一大供應商,未來還將逐步深入到更多業務領域,包括銀行智慧網點的轉型、銀行風控的管理提升等,以人臉識別業務為切入點,利用人工智能技術幫助銀行業務的全面優化升級。

  而在最近的高交會上,雲天勵飛攜成功流片的AI芯片亮相,計劃在明年正式商用。未來,雲天勵飛還將探索芯片商業模式的創新,力推“芯片+服務”的新模式,打造芯片共享平台。

  在橫向拓展方面,AI公司紛紛布局智慧零售、智慧社區、智慧教育等,由於落點不同,相互間避開了同質化競爭,如在零售領域,相比擅長做硬件的友商,雲從比較著重做零售大腦,軟件或平台相關等﹔雲天勵飛將線下信息結構化,消費者在商店買了哪些東西,其興趣點在哪兒,以前隻能通過互聯網建模的商業模式,現在在線下也能做﹔今年5月,商湯還聯手華東師大,推出第一本人工智能教材,入局智慧教育。

  “AI一定要與行業結合才是有生命力的。”劉念說,傳統行業與AI結合,需要數據確定模型,但在服裝等行業連基本的數據都沒有,也沒有IT架構,“比如客戶和我們洽談的時候非常興奮,對AI的需要很強烈,但一談到落地就遇到很多問題,純視覺的方案根本解決不了,這都需要AI公司幫助企業將數據整理出來”。

  楊帆則表示,新事物層出不窮,行業風口不斷變遷,但回歸到事情本質其實是很簡單的,整個信息產業依然是非常關鍵的五個關鍵環節,分別是對採集、傳輸、存儲、分析計算和反饋的利用、整合和技術的進步。AI公司雖然一開始比拼的是信息採集環節,在採集環節實現了高度自動化后,比拼的是對信息的分析和反饋,才能建立起一個完整的閉環,“攝像頭是非常重要的採集環節,也有一些AI能力建立在攝像頭上,但最重要的還是在后端,分析環節將創造巨大價值。”

  專家點評

  廣州市社會科學院產業所

  副研究員 陳峰

  政府應主動推進

  數據資源整合

  讓企業合規利用

  我國計算機視覺從2010年開始加快發展,目前市場已具備一定集中度,據IDC報告,2017年計算機視覺“四小龍”——商湯、依圖、曠視、雲從佔總體市場份額高達近七成。安防、金融、手機是計算機視覺技術最大的應用場景,預計未來在醫療影像、自動駕駛、機器人、智能制造等場景下,計算機視覺技術應用前景廣闊。

  政府是加速人工智能技術落地應用的重要推動力量,為進一步推動計算機視覺產業的快速健康發展,在讓市場在資源配置中起決定性作用的前提下,政府應積極有為,在數據開放和應用場景供給方面發揮統籌、引領作用。

  大數據對促進計算機視覺的識別與認識能力至關重要,所有的計算機視覺企業都需要大量的數據來訓練、迭代自己的產品。在目前計算機識別技術各家差別不大的情況下,數據是業內企業發展的一個重要競爭優勢來源。我國政府、央企手中掌握著全社會最大、最核心的數據。政府應積極主動推進數據資源的整合、開放與應用,組織界定數據採集、應用的范圍和方式,出台公共數據採集與使用規范,明確相關主體的責權和義務,為公共數據開放掃清障礙﹔引導市場主體、各企業之間合法合規開展數據資源的合作與交易﹔加快研究、制訂相關法律法規,從法律層面到執行層面確保信息安全和個人隱私得到充分尊重,為計算機視覺產業健康快速發展創造條件。

  計算機視覺是AI最熱門的融資領域,據不同機構的數據,計算機視覺融資佔AI的比重基本都能排進前三,其中人臉識別、圖像識別、視頻識別三大方向,是資本市場炙手可熱的明星,業內頭部企業——計算機視覺“四小龍”,融資和估值節節攀升。但是,回到技術落地和商業變現,行業整體情況並不樂觀,絕大多數企業依然處於前期燒錢階段。目前,安防、金融、交通是計算機視覺技術商業落地的主要應用場景,業務主要來自公安、機場、邊檢、海關、火車站、銀行等,政府在行業早期市場培育方面給予了極大的支持。未來,政府在應用場景供給方面仍有很大的深化、優化空間,在智慧政務、智慧校園、智慧醫療、智慧交通等領域,會有越來越多的應用場景被挖掘出來,各級政府在推進智慧城市建設、應用示范項目建設中,可將符合條件的計算機視覺產品(服務)納入首購應用,支持計算機視覺技術、產品、模式的應用推廣。

(責編:趙超、楊波)

分享讓更多人看到

返回頂部