首頁
黨政
- 黨網 · 時政
- 人事
- 反腐
- 理論
- 黨史
- 黨建
要聞
- 經濟 · 科技
- 社會 · 法治
- 文旅 · 體育
- 健康 · 生活
- 國際
- 軍事
- 港澳
- 台灣
- 教育
- 房產
- 科普
觀點
互動
可視化
- 視頻
- 圖片
- 圖解
地方
- 京
- 津
- 冀
- 晉
- 蒙
- 遼
- 吉
- 黑
- 滬
- 蘇
- 浙
- 皖
- 閩
- 贛
- 魯
- 豫
- 鄂
- 湘
- 粵
- 桂
- 瓊
- 渝
- 川
- 黔
- 滇
- 藏
- 陝
- 甘
- 青
- 寧
- 新
- 鵬
- 雄安
舉報專區
多語言
- |
合作網站
登錄

退出

AI，無師自通，自學成才？

張夢然

2017年10月23日08:49 | 來源：科技日報

小字號

原標題：AI，無師自通，自學成才？

　　圖片來自網絡

　　人工智能（AI）領域再次出現驚人突破——據英國《自然》雜志近日發表的論文報道，一款新版的“阿法狗”（AlphaGo）計算機程序能夠從空白狀態起，在不需要任何人類棋譜輸入的條件下，自學圍棋，無師自通，自學成才。

　　這款新程序名叫“阿法元”（AlphaGo Zero），其以100比0的不敗戰績，狠狠打擊了曾書寫歷史的舊版“阿法狗”。

　　實力，“阿法狗”的輝煌戰績

　　人工智能“阿法狗”出自谷歌旗下深度思維（DeepMind）公司。最早在2016年1月，《自然》雜志以封面位置報道該程序在和所有其他圍棋程序的對抗中獲得了99.8%的勝率，並且以5︰0的成績打敗了歐洲圍棋冠軍。

　　隨后同年3月，“阿法狗”挑戰世界圍棋冠軍李世石，經五局鏖戰，人類1︰4不敵人工智能，引發巨大轟動。人們的震驚源於在圍棋19×19棋盤上，一步甚至會有幾百種走法，傳統的人工智能算法難以估計局面和下子。

　　但“阿法狗”仍在積攢實力。今年1月，一個神秘賬號Master公布自己正是“阿法狗”新版。該賬號在知名圍棋平台上先后挑戰柯潔、朴廷桓和井山裕太等頂級高手，豪取勝利，隨后戰贏“棋聖”聶衛平，直至60盤時自爆身份，決勝收官。

　　3天，“阿法元”的無師自通

　　此次在最新論文中，英國倫敦深度思維公司“阿法狗”項目的主要負責人戴維·西爾弗、戴密斯·哈薩比斯及其同事，報告了新版“阿法狗”軟件——“阿法元”。

　　“阿法元”最引人注目之處在於其無師自通的本領。其學習從“零”開始，單純基於與自己的對弈，不需要任何歷史棋譜的指引，也不需要任何人類經驗的點撥。

　　對於這個新軟件，人類的輸入僅僅限於一張棋盤和一副棋子，沒有任何人類數據參與。“阿法元”隻用到了一張神經網絡，這張網絡經過訓練，專門預測程序自身的棋步和棋局的贏家，讓“阿法元”在每次自我對弈中進步。

　　通過3天的訓練——包括近500萬局自我對弈——“阿法元”已能夠超越人類並打敗之前的“阿法狗”版本。戴維·西爾弗表示，“阿法元”遠比“阿法狗”強大，它已不再為人類的知識所限，而能夠自行發現新知識。

　　擺脫了人類經驗的輔助和依賴，人工智能竟然變得更強！在“阿法元”嶄露頭角后，人們揣測：難道我們人類還耽誤“阿法狗”了？

　　震驚，AI的獨立發現

　　其實，人工智能的最大挑戰之一，即是研發一種能從“零”開始、以超人類的水平學習復雜概念的算法。

　　在去年3月那場世所矚目的比賽中，“阿法狗”軟件打敗了人類圍棋世界冠軍。當時的這款圍棋程序，是利用價值網絡去計算局面，用策略網絡去選擇下子。

　　但為了贏得這場人機大戰，科學家團隊在訓練“阿法狗”時，同時用到了監督式學習（基於上百萬種人類專業選手的下棋步驟）和基於自我對弈的強化學習。舊“阿法狗”訓練過程長達幾個月，用到多台機器和48個TPU（神經網絡訓練所需的專業芯片）。

　　而此次，據研究團隊介紹，新程序“阿法元”隻使用了一台機器和4個TPU。

　　在“阿法狗”之前，最成功的圍棋程序僅能達到人類業余選手的程度，還不能在不讓子的情況下和專業賽手一較高下，原本人們認為，至少要10年后人工智能才有可能達到這一成就。但“阿法狗”的橫空出世改寫了預言。而在其問世不足兩年的時間裡，“阿法元”再次刷新人們的認知——隨著程序訓練的進行，人工智能已獨立發現了人類用幾千年才總結出來的圍棋規則，還建立了新的策略，可以說，人工智能已經為這個古老的游戲，帶來全新見解。

(責編：易瀟、畢磊)

分享讓更多人看到

相關新聞

客戶端下載

熱門排行

人民日報社概況 | 關於人民網 | 報社招聘 | 招聘英才 | 廣告服務 | 合作加盟 | 供稿服務 | 數據服務 | 網站聲明 | 網站律師 | 信息保護 | 聯系我們

服務郵箱：kf@people.cn 違法和不良信息舉報電話：010-65363263 舉報郵箱：jubao@people.cn

互聯網新聞信息服務許可証10120170001 | 增值電信業務經營許可証B1-20060139

廣播電視節目制作經營許可証（廣媒）字第172號 | 互聯網藥品信息服務資格証書（京）-非經營性-2016-0098

信息網絡傳播視聽節目許可証0104065 | 網絡文化經營許可証京網文[2020]5494-1075號 | 網絡出版服務許可証（京）字121號 | 京ICP証000006號 | 京公網安備11000002000008號

人民網版權所有，未經書面授權禁止使用
Copyright © 1997-2021 by www.people.com.cn. all rights reserved

評論
分享
關注
微信微博快手
第一時間為您推送權威資訊

報道全球傳播中國

關注人民網，傳播正能量

返回頂部