RodneyShag/GridWorldMDP - Gitstar Ranking

RodneyShag

Fetched on 2026/06/23 05:29

Uses Markov decision processes (MDPs) and Temporal Difference (TD) Q-learning to maximize reward in a "grid world". - View it on GitHub

Star

Rank

3374726