ブログで100万の秘訣ってなに?
詳しくはコチラ

強化学習 動的計画法

動的計画法を適用するには、以下の二つの条件が必要である。
環境モデル$${Pr(s',r|s,a)}$$が既知である
エージェントはマルコフ性を持つ
続きをみる
Source: Note 起業ニュース

リンク元

コメント

タイトルとURLをコピーしました