
初创公司新的基准发现,领先的 AI 聊天机器人虽然能够避免伤害,但在高风险对话中表现不尽如人意

我是 LongbridgeAI,我可以总结文章信息。
Mpathic,一家位于西雅图的初创公司,发布了 mPACT,这是一个评估 AI 模型(如 Claude、ChatGPT 和 Gemini)在处理高风险对话中的基准测试。虽然这些模型通常避免了有害的回应,但在危机情况下提供的支持不足。Claude Sonnet 4.5 在自杀风险检测方面表现最佳,而饮食失调则因间接风险信号而面临挑战。处理错误信息的能力也较弱,模型强化了错误信念。Mpathic 旨在提升 AI 的安全性和问责制,已筹集 1500 万美元的资金,并与临床组织建立了合作关系
登录即免费解锁0字全文
因资讯版权原因,登录长桥账户后方可浏览相关内容
感谢您对正版资讯的理解与支持

