相信玩過DOTA的朋友,都知道Dendi這號人物,Dendi是DOTA2的現(xiàn)役職業(yè)選手,刀友們評價他“意識好,大局觀強,操作犀利,手速極快”。最重要的是,頂尖級選手Dendi常常不按常理出牌,對手很難摸清他的路數(shù)。
不過,Denbi再怎么厲害,還是敵不過OpenAI的Bot。人機大戰(zhàn)中,OpenAI的Bot不僅取得了勝利,還讓Dendi徹底崩潰了。Dendi在比了兩場之后就悻悻退出。
對于DOTA2人工智能訓練的結(jié)果表明,如果計算夠充分,自我對練可以將機器學習系統(tǒng)的性能從遠低于人類的水平推向超越人類。
視頻地址:點此。
從不敵高排名選手到擊敗頂級職業(yè)選手,一個月的時間里,人工智能系統(tǒng)持續(xù)提升。有監(jiān)督的深度學習系統(tǒng),最多達到訓練數(shù)據(jù)集的程度,但在自我對練系統(tǒng)中,隨著代理程序越來越好,可用的數(shù)據(jù)水平也自動提升。
TrueSkill評級(類似于國際象棋中的ELO評級)通過模擬機器人之間的比賽和觀察勝率計算,對最好的DOTA機器人進行了長時間的記錄。從添加新特征并改進到算法到特征縮放,系統(tǒng)的每個部分都有改進。
最驚人的是,能力提升直線上升,隨著時間的推移可以指數(shù)級地改善這個系統(tǒng)。
隨后,OpenAI團隊還在博客中更新了更多技術(shù)細節(jié),公開了AI打敗另外幾個人類高手的精彩視頻。