OpenAI 訓練了 o1 和 o3 來 ‘考慮’ 其安全政策

TechCrunch
2024.12.22 18:32
portai
我是 PortAI,我可以總結文章信息。

OpenAI 推出了新的 AI 推理模型 o1 和 o3,這些模型採用了一種名為 “深思熟慮對齊” 的新安全訓練方法。該方法使模型在推理過程中能夠考慮 OpenAI 的安全政策,從而提高與安全原則的對齊程度,並減少不安全的響應。這些模型在將複雜提示分解為可管理的步驟方面表現出色,但在平衡安全性與響應延遲方面仍面臨挑戰。OpenAI 的目標是確保其 AI 在處理用户提示的複雜性時,不會對不安全的請求提供幫助