OpenAI 训练了 o1 和 o3 来 ‘考虑’ 其安全政策

TechCrunch
2024.12.22 18:32
portai
我是 PortAI,我可以总结文章信息。

OpenAI 推出了新的 AI 推理模型 o1 和 o3,这些模型采用了一种名为 “深思熟虑对齐” 的新安全训练方法。该方法使模型在推理过程中能够考虑 OpenAI 的安全政策,从而提高与安全原则的对齐程度,并减少不安全的响应。这些模型在将复杂提示分解为可管理的步骤方面表现出色,但在平衡安全性与响应延迟方面仍面临挑战。OpenAI 的目标是确保其 AI 在处理用户提示的复杂性时,不会对不安全的请求提供帮助