算法的進(jìn)化
發(fā)布日期:2021/12/24 17:05:01 瀏覽量:
現(xiàn)代算法可以根據(jù)每個(gè)人的喜好推薦有趣的東西,是可以自我學(xué)習(xí)的。算法通過(guò)與用戶之間的交互過(guò)程,獲取用戶的個(gè)人偏好信息,并從中學(xué)習(xí)進(jìn)一步完善自身,發(fā)現(xiàn)其中的關(guān)聯(lián)關(guān)系,以便為下一位用戶提供更優(yōu)質(zhì)的推薦信息。這種算法多用于電影、音樂(lè)、書籍的推薦。
最出名的應(yīng)用算法的便是谷歌的DeepMind團(tuán)隊(duì)研發(fā)創(chuàng)造的AlphaGo。機(jī)器算法的學(xué)習(xí)的目標(biāo)在于構(gòu)建關(guān)于特定問(wèn)題有針對(duì)性的解決方案。數(shù)據(jù)本身無(wú)法自給自足,它必須與知識(shí)相結(jié)合。正是在這一點(diǎn)上,人類的思維和智慧似乎能更好地應(yīng)對(duì)環(huán)境的變化并對(duì)全局進(jìn)行把控—至少在目前看是這樣。AlphaGo也同樣經(jīng)歷了基礎(chǔ)學(xué)習(xí)階段?;ヂ?lián)網(wǎng)上存在數(shù)以萬(wàn)計(jì)的棋局錄像。通過(guò)檢索就能找到破除困局的關(guān)鍵一招。這樣龐大的數(shù)據(jù)庫(kù)的建立使得只要給定一個(gè)棋盤位置,算法便可分析出每一步落子對(duì)獲勝的影響概率。之后便是強(qiáng)化學(xué)習(xí)階段。即算法通過(guò)自我對(duì)戰(zhàn),強(qiáng)化學(xué)習(xí)來(lái)提高對(duì)弈水平。這種強(qiáng)化學(xué)習(xí)會(huì)綜合生成大量的新數(shù)據(jù),有助于算法發(fā)現(xiàn)自身可能存在的弱點(diǎn)。
目前DeepMind團(tuán)隊(duì)又開發(fā)出了新一代的AlphaGo—AlphaZero,它打敗了曾書寫歷史的各版本AlphaGo前輩。沒(méi)有使用人類的知識(shí),從零開始訓(xùn)練,使它已不再受人類的思維和游戲方式的限制了。
AlphaGo并不是要打敗人類,而是要發(fā)現(xiàn)做科學(xué)研究意味著什么,讓程序能通過(guò)自學(xué)最終學(xué)習(xí)到哪些知識(shí)。
馬上咨詢: 如果您有業(yè)務(wù)方面的問(wèn)題或者需求,歡迎您咨詢!我們帶來(lái)的不僅僅是技術(shù),還有行業(yè)經(jīng)驗(yàn)積累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 聯(lián)系人:石先生/雷先生