美团 LongCat 团队发布 VitaBench

智通财经
2025.10.20 09:05
美团 LongCat 团队今日正式发布当前高度贴近真实生活场景、面向复杂问题的大模型智能体评测基准——VitaBench。据介绍,VitaBench 以外卖点餐、餐厅就餐、旅游出行三大高频真实生活场景为典型载体,构建了包含 66 个工具的交互式评测环境,并进行了跨场景的综合任务设计。