超越基准:为何人工智能需要一个以人为本的评分体系

StartupHub
2025.12.20 21:20
portai
我是 PortAI,我可以总结文章信息。

Andrew Gordon 和 Nora Petrova 来自 Prolific 认为,目前的人工智能评估过于侧重技术基准,而忽视了人际互动。他们提出了 HUMAINE 排行榜,专注于以人为本的指标,如信任和文化一致性。这种方法旨在提高人工智能的实际效用和安全性,解决如谄媚和缺乏人口代表性等问题。该倡议强调人工智能发展需要与人类价值观相一致,并提供一个透明的框架以进行有意义的人工智能评估