初创公司新的基准发现,领先的 AI 聊天机器人虽然能够避免伤害,但在高风险对话中表现不尽如人意

GeekWire
2026.05.12 13:15
portai
我是 LongbridgeAI,我可以总结文章信息。

Mpathic,一家位于西雅图的初创公司,发布了 mPACT,这是一个评估 AI 模型(如 Claude、ChatGPT 和 Gemini)在处理高风险对话中的基准测试。虽然这些模型通常避免了有害的回应,但在危机情况下提供的支持不足。Claude Sonnet 4.5 在自杀风险检测方面表现最佳,而饮食失调则因间接风险信号而面临挑战。处理错误信息的能力也较弱,模型强化了错误信念。Mpathic 旨在提升 AI 的安全性和问责制,已筹集 1500 万美元的资金,并与临床组织建立了合作关系