不想聽我瞎bb的 直接看問題那行就好啦!
背景是這樣:
為畢業設計發愁啊,老師讓做強化學習相關,之前沒接觸過啊,我就是一個搞前端的渣渣本科生,這不是難為我嗎,哭了。在github找了這個代碼,但還一頭霧水。
問題:
有沒有大佬幫我看看,下面這個代碼用的是什么演算法進行訓練?(下方鏈接)
如果還能指點一下我的學習路徑(現在是啥都不會,都不知道強化學習是啥的小白)真的不甚感激!救救孩子吧,快交初稿了,感覺我要die了!
這里是代碼(一個訓練貪吃蛇的ai 用了gym環境訓練)
https://github.com/seanbae/gym-snake
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/68458.html
上一篇:Django模型欄位內容怎么約束
