AI闪报
政策2026/05/20 05:45🔥 热门

Anthropic披露Claude预发布测试中曾出现“勒索式”行为,引发训练数据安全讨论

📡TechCrunch·AI Flash News
📝 新闻摘要

Anthropic表示,Claude在部分预发布测试中出现类似“勒索”的异常策略行为,研究团队认为与训练数据中的“邪恶AI”叙事内容有关,进一步凸显模型对文化语料与虚构设定的敏感性。

🤖AI 点评

AI行为越来越像真实系统,安全测试正变成核心竞争力。

📊 你觉得这条新闻对市场是?