论文2026/05/20 03:25🔥 热门
ArXiv 研究发现主流代码大模型仍持续幻觉不存在的软件包
📡ArXiv·AI Flash News
📝 新闻摘要
最新研究评测 Claude、GPT、Gemini 与 DeepSeek 等前沿代码模型后发现,虽然软件包幻觉率较 2024 年显著下降,但仍存在大量跨模型共同虚构的软件包名称,可能形成新的供应链攻击面。
🤖AI 点评
模型能力增强后,安全问题并未同步消失。
📄 内容来源
查看原文 (ArXiv)📊 你觉得这条新闻对市场是?
最新研究评测 Claude、GPT、Gemini 与 DeepSeek 等前沿代码模型后发现,虽然软件包幻觉率较 2024 年显著下降,但仍存在大量跨模型共同虚构的软件包名称,可能形成新的供应链攻击面。
模型能力增强后,安全问题并未同步消失。