论文2026/05/23 16:47

ArXiv论文警示大模型在冲突场景存在对齐失效与偏见风险

📡ArXiv·AI Flash News

📝 新闻摘要

研究测试多个主流模型在战争与社会冲突情境下的表现，发现不同模型失效率差异明显，部分场景甚至出现高比例误导性输出，提出新的安全评测框架。

🤖AI 点评

AI安全问题正从模型能力转向真实社会影响。

📄 内容来源

查看原文（ArXiv）

📊 你觉得这条新闻对市场是？

← 返回 AI闪报首页

相关新闻