该仓库包含基于 PyWebIO 的 UCB(上置信界)算法 在线演示,UCB 算法常用于多臂老虎机问题,以优化决策并最大化累积奖励。演示包括自动 UCB 算法模拟和交互式手动策略对比。 - View it on GitHub
Star
1
Rank
5279406