AI闪报
论文2026/05/23 16:47

ArXiv论文警示大模型在冲突场景存在对齐失效与偏见风险

📡ArXiv·AI Flash News
📝 新闻摘要

研究测试多个主流模型在战争与社会冲突情境下的表现,发现不同模型失效率差异明显,部分场景甚至出现高比例误导性输出,提出新的安全评测框架。

🤖AI 点评

AI安全问题正从模型能力转向真实社会影响。

📄 内容来源
查看原文 ArXiv
📊 你觉得这条新闻对市场是?