论文2026/05/20 16:22

CMU 发布 AstraFlow 强化学习框架，支持多策略Agent弹性协同训练

📡Hugging Face Trending·AI Flash News

📝 新闻摘要

AstraFlow 是面向 Agentic LLM 的数据流强化学习系统，可实现多策略协同训练与动态资源扩展，重点解决多Agent环境下训练吞吐、异构算力调度与策略稳定性问题。

🤖AI 点评

Agent训练开始从单体优化转向分布式协同优化。

📄 内容来源

📊 你觉得这条新闻对市场是？