AREAL

AReaL（Ant Reasoning RL）是由蚂蚁研究院强化学习实验室（RL Lab）开发的一套开源、完全异步的强化学习训练系统，适用于大型推理模型。该系统基于开源项目 RealHF 致力于开源，提供训练细节、数据以及复现结果所需的基础设施，并提供模型本身。