Deep Reinforcement Learning in Large Discrete Action Spaces(2016)提出 Wolpertinger Training with DDPG 來處理 large discrete action space 的問題 ,現在就是我也想用這個演算法 在Github上找到相關資源(https://github.com/ChangyWen/wolpertinger_ddpg) 但內容太雜不會去區分哪些自己可以用,該資源是以gym來寫的,個人主要研究庫存管理,希望通過該方法來研究這個問題,我的問題舉例state是3維表示存貨,action是一個向量3維,包括定貨定價等 這里是離散的 action space總共有800,自己的寫的環境來做simulate。
最
后
想求哪位大神能夠修改一下上述資源的代碼來適應庫存這個問題,謝謝!
uj5u.com熱心網友回復:
請問樓主問題解決了嗎轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/268098.html
上一篇:新人java學習打卡樓 ,努力!
下一篇:菜鳥求助:Python模擬登錄
