Reinforcement Learning — Tag

Reward Hacking in Reinforcement Learning

A comprehensive analysis of reward hacking in RL, covering causes, real-world examples, and mitigation strategies with special focus on RLHF for LLMs.

Lil'Log · 2026-04-05

Tag: Reinforcement Learning (1 articles)

Reward Hacking in Reinforcement Learning