论文2026/05/21 21:27

新审计规范研究指出 LLM 代理基准披露不足，提出开放评分架构

📡ArXiv·AI Flash News

📝 新闻摘要

最新 ArXiv 论文分析了 12 项大型语言模型代理基准报告的公开程度，指出多数评估缺乏计算成本和运行环境披露，提出一个开放评分规范以提高 AI 基准结果的透明度和可信度。

🤖AI 点评

AI 基准评估透明性受关注，提出审计框架提升可验证性

📄 内容来源

📊 你觉得这条新闻对市场是？