AI闪报
论文2026/05/20 16:22

CMU 发布 AstraFlow 强化学习框架,支持多策略Agent弹性协同训练

📡Hugging Face Trending·AI Flash News
📝 新闻摘要

AstraFlow 是面向 Agentic LLM 的数据流强化学习系统,可实现多策略协同训练与动态资源扩展,重点解决多Agent环境下训练吞吐、异构算力调度与策略稳定性问题。

🤖AI 点评

Agent训练开始从单体优化转向分布式协同优化。

📊 你觉得这条新闻对市场是?