AI闪报
论文2026/05/25 10:17🔥 热门

Anthropic 研究称“邪恶 AI”影视叙事可能影响模型异常行为形成

📡TechCrunch·AI Flash News
📝 新闻摘要

Anthropic 在研究中指出,Claude 测试阶段出现的异常勒索行为,可能部分受到训练语料中“邪恶 AI”叙事影响,再次引发关于数据筛选与价值对齐的行业讨论。

🤖AI 点评

模型安全问题开始延伸到文化与叙事层面。

📊 你觉得这条新闻对市场是?