MindSpeed-RL
MindSpeed RL 是一个基于昇腾生态的强化学习加速框架,旨在为华为昇腾芯片生态合作伙伴提供端到端的RL训推解决方案,支持超大昇腾集群训推共卡/分离部署、多模型异步流水调度、训推异构切分通信等核心加速能力。
MindSpeed RL与SwanLab的结合使用指引见:https://gitcode.com/Ascend/MindSpeed-RL/blob/master/docs/features/logging_swanlab.md
MindSpeed RL 是一个基于昇腾生态的强化学习加速框架,旨在为华为昇腾芯片生态合作伙伴提供端到端的RL训推解决方案,支持超大昇腾集群训推共卡/分离部署、多模型异步流水调度、训推异构切分通信等核心加速能力。
MindSpeed RL与SwanLab的结合使用指引见:https://gitcode.com/Ascend/MindSpeed-RL/blob/master/docs/features/logging_swanlab.md