人民網
人民網>>IT

識別精確度超過95% 智能語音技術讓生活更簡單

胡喆
2017年12月11日10:45 | 來源:新華社
小字號
原標題:識別精確度超過95% 智能語音技術讓生活更簡單

多部門合力打造國家級專家庫,百度、阿裡雲、騰訊、科大訊飛等分別啟動建設“自動駕駛、城市大腦、醫療影像、智能語音”4家國家新一代人工智能開放創新平台……近日,隨著我國新一代人工智能發展規劃暨重大科技項目的啟動實施,我國在人工智能領域頻頻發力、引發社會高度關注。

作為在這四大領域當中走在前列的一隅,我國的智能語音識別技術有何“長處”?識別精確度超過95%的智能語音新技術又將怎樣改變生活?

從60.2%提升到95%以上:語音識別已經“准出新高度”

連珠的妙語、閃爍的字幕……科大訊飛董事長劉慶峰在一次演講中,向人們展示了智能語音識別技術和其應用所具備的“魔力”。劉慶峰在演講的同時使用著最新的智能語音識別技術——可以讓他演講的內容實時以中英文雙字幕的形式呈現在大屏幕上,反應迅速、幾乎沒錯。

“基於‘訊飛超腦計劃’,科大訊飛開啟了一場以語音和語言為入口的‘認知革命’。”劉慶峰介紹,過去6年中,他們的語音識別技術准確率從60.2%提升到95%以上,已全球領先。

6年前,科大訊飛推出了全球首個語音雲開放平台。目前,該平台的日處理次數達到40億次。“在語音合成方面,中國已是國際上的領先者。”科大訊飛副總裁胡郁介紹。

劉慶峰認為,人工智能面臨前所未有發展機遇,科大訊飛如果隻做技術提供方,會處於一個相對被動和弱勢的地位,所以提出了“平台+賽道”發展路徑,將人工智能技術賦能給廣大開發者,加快推廣應用。

導航、醫療、公檢法:多的是你不知道的“智能語音”

“我是羅永浩,你鎮定一下,我要開始導航了。”這是高德地圖羅永浩版本的導航聲音片段。高德地圖2014年首次使用語音合成技術實現明星導航,林志玲語音上線即引發轟動。隨后,先后推出羅永浩等明星導航音。

近年來,隨著人工智能熱潮的襲來,以智能語音為代表的各類應用也層出不窮。如QQ閱讀調用訊飛語音合成技術推出有聲聽書﹔蝦米音樂使用訊飛語音識別技術,推出哼唱檢索……

科大訊飛通過與公檢法系統開展創新合作,使智能語音技術不斷拓展著應用的新疆域。2016年在安徽開展的測試顯示,人工智能判斷詐騙電話的准確率極高﹔人工智能還充當起法庭書記員,經測試,智能語音識別參與庭審取得實際效果,庭審時長縮短30%。

在中部某省立醫院門診大廳,兩台機器人格外吸引人。“您好,我是導診機器人‘曉醫’,很高興為您服務。關於科室位置在哪,去哪個科室,還有就診遇到的問題,這些都可以問我哦。”熟悉219個常見病和症狀對應的科室信息,“曉醫”可通過智能語音識別技術,每天服務近5000次。

“人工智能的關鍵是把復雜的世界簡單化。”百度公司董事長兼首席執行官李彥宏表示,未來30年至50年,人工智能將成為推動人類歷史進步的強大動力。

讓未來充滿“意想不到”:人工智能會否成“脫缰野馬”?

按照業內人士的預估,未來不僅在我們已知的領域,在一些未知領域,“智能語音”技術也會帶給人們許多“意想不到”的突破。

人工智能在“改卷子”方面的能力,就超乎了人們的想象。在江蘇省的高考智能閱卷驗証中,兩個不同的人工智能語文作文閱卷分差小於7分,一致率達92.82%,比兩位老師的閱卷評分的一致率高出5%以上﹔在湖南省研究生考試的智能閱卷驗証中,兩個不同的人工智能分別對英語作文進行閱卷評分,分差小於6分的一致率竟高達99.83%,比兩位老師的閱卷評分一致率高出了4%以上。

據悉,教育部考試中心正聯合科大訊飛建設人工智能聯合實驗室,在教育領域醞釀著更多“黑科技”的誕生。

自平台開放以來,科大訊飛基於這一平台的各類開發者數量由去年同期的20.2萬增至45萬,增長123%,語音雲日均使用次數由25.7億次增至超過40億次。開發者們在平台將語音技術快速集成到產品中,讓產品具備“能聽會說會思考會預測”的功能。

專家指出,一方面要構建開放協同的人工智能科技創新體系,加強關鍵共性技術攻堅,增加人工智能創新的源頭供給。另一方面,要培育高端高效的智能經濟,圍繞教育、醫療、養老等民生需求和熱點難點,加快創新應用,促進人工智能與各產業領域深度融合,積極培育新興業態,布局產業鏈高端,全面提升質量和效益。

(責編:易瀟、楊虞波羅)

分享讓更多人看到

返回頂部