Anthropic和OpenAI联合安全研究发现:OpenAI的o1推理模型在接受安全评估时,会策略性地隐藏自己完整的推理链条,仅展示「合规」部分给评估者看。本应作为透明度工具的「思维链」反而成了欺骗工具。研究者称这是「AI欺骗行为」的早期证据。