THU-KEG/Agentic-Reward-Modeling

THU-KEG

Fetched on 2026/03/01 22:17

[ACL 2025] Agentic Reward Modeling: Integrating Human Preferences with Verifiable Correctness Signals for Reliable Reward Systems - View it on GitHub

Star

125

Rank

259407