宁本哲

课程 ID: 11672

描述:
大模型 AI Infra 资深技术专家，专注大模型训练优化与强化学习后训练框架领域。曾在华为主导 MindSpeed-RL 强化学习训练框架的系统设计与工程实现，积累了深厚的分布式训练性能调优经验。现就职于小红书，承担大模型后训练框架的核心架构设计与研发工作，持续推动 RL 训练系统在工业级场景下的落地与演进。