--- title: "“偷” 数据,用特斯拉显卡,马斯克把 AI 炼成啥样了?" description: "马斯克的 Grok2 AI 模型在性能上有显著提升,表现优异,综合能力排名第三,并新增图片功能,特别擅长数学和常识性问题。一个匿名模型 sus-column-r 的发布引起关注,实为 xAI 的 Grok2。Grok2 的对战胜率表显示其在大模型竞技场中表现杰出,基本与市面上最先进的 AI 不相上下。" type: "news" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/211730419.md" published_at: "2024-08-16T00:21:50.000Z" --- # “偷” 数据,用特斯拉显卡,马斯克把 AI 炼成啥样了? > 马斯克的 Grok2 AI 模型在性能上有显著提升,表现优异,综合能力排名第三,并新增图片功能,特别擅长数学和常识性问题。一个匿名模型 sus-column-r 的发布引起关注,实为 xAI 的 Grok2。Grok2 的对战胜率表显示其在大模型竞技场中表现杰出,基本与市面上最先进的 AI 不相上下。 差评 X.PIN(ID:chaping321),作者:世超,编辑:江江,题图来自:视觉中国 马斯克的 Grok2 AI 模型在性能和特色上有显著提升。 • 🚀 Grok2 在大模型竞技场上表现优异,综合能力排名第三。 • 🖼️ 新增图片功能,与 FLUX.1 合作,整活能力突出。 • 🧠 在数学和常识性问题上表现优秀,并与 GPT-4o 一较高低。 有个怪事儿,前段时间,大模型竞技场上,一个代码为 sus-column-r 的匿名模型横空出世。 没人知道它师出何门,但在过去的一个月里,它却称得上是过关斩将…… 累计一万多人的投票,硬生生让它挤进了排行榜前列。到现在,综合能力已经和 5 月 13 号发的**GPT-4o**(API 版本)**并列第三**了。 看这势头,当时就有不少人猜测,这可能是 OpenAI 那个迟迟没向大众公布的,神秘的**“草莓 Q\*”**项目。 然而,就在昨天,这个困扰大伙儿很久的谜语,终于有答案了。但解开它的,不是 OpenAI,而是经常被大家忽略,但也在搞 AI 的马斯克。 这个匿名的 sus-column-r 模型,其实就是 xAI 要推出的**新模型 Grok2**,现在已经上线会员版的 X 了。 而之所以在大模型竞技场上整这么一出,说白了,是想给昨天的发布热热场子。 像是在官宣推出 Grok2 的博客里,就明晃晃地展示了之前 sus-column-r 积累的战绩,甚至还做了**对战胜率表**。 按照他们自个儿的说法,表里面除了谷歌的 Gemini 1.5 Pro 外,其余无论是 GPT-4o,还是 Claude3.5 Sonnet,都只能是 Grok2 的 “手下败将”。 当然了,其他的纸面成绩,Grok2 答得也挺不错。光从各个基准的数据来看,它的各项能力,都和市面上最先进的 AI 差不多,这一线大模型的行列,也算是被 Grok 给挤进去了。 不过,一个模型好不好,光看这些数据也还不行,最重要的是,得看大伙们的实际使用体验。 相较于上次的还只能文字开开玩笑的 Grok1.5,这次 Grok2 最明显的一个升级,就是**新增了图片功能**。 但和其他家自己动手搞多模态 AI 不一样,这次马斯克倒挺罕见地选择了和别人合作。 合作的对象,差友们应该还有点印象,就是前两天咱刚写过的**FLUX.1**。 看到这,世超也没对 Grok2 的图片功能抱太大的期待,毕竟是前脚刚试过的 AI…… 但没想到集成到 Grok2 里面的 FLUX.1,还真撞出了一点不一样的火花。 倒也不是说,在性能上它一夜之间飙升了一大截。而是相较于市面上的其他图片 AI,Grok2 的**整活能力**可以称得上是一骑绝尘。 同样是迪士尼公主的一个提示词,Grok2 在**尺度上**就比其他模型要大胆得多。 而且,Grok2 还能直接对着自己的老板**恶搞**,比如这是一个爱吃甜品,吃到发胖的马斯克。 转眼,他还能穿越到权力的游戏里,玩角色扮演。 更搞的是,还有网友直接拿 Grok2 生成的图,和视频 AI 配合起来,做起了视频。 不过,Grok2 这么肆无忌惮地**恶搞各种公众人物、卡通人物**,风险肯定还是有的。 像是有网友生成马里奥抽烟喝酒、观望 “911” 事件的图片,就已经有人督促任天堂起诉了。 除了新增有图片功能外,Grok2 这次提升的基础能力,咱肯定也得上手测测,看看实力。 考虑到目前 X 上线的,还只是性能差一点的小杯 mini 版,于是世超在大模型竞技场上,试用了下能力更强的 Grok2,还拉来了最新版本的 GPT-4o 作比较。 比试第一招,先从 AI 容易犯错的题目开始。前段时间,大模型集体在 “小数比较” 上翻车,大伙应该都听说过了。 这次再来波经典重现,让它俩来比比**9.5 和 9.11**的大小。 没想到的是,GPT-4o 依旧是死性不改,结果对了,但一看解题思路,完全就是一塌糊涂。反倒是 Grok2 倒有理有据,给出了正确答案。 还有经典的数数问题,GPT-4o 依旧让人大跌眼镜,“我一把把把把住了” 它竟然数出来 5 个把字,Grok2 这边倒还是稳定发挥。 不过紧接着问它俩这句话的意思,Grok2 就有点露怯了,乱说了一大堆,没一个踩到得分点。而这次 GPT-4o 简单几句话就给解释清楚了。 接下来世超又试了一些比较基础的**常识性问题**,比如说 “李政道是谁”,它俩回答的,都还算正确。就是不知道为啥,GPT-4o 很容易犯懒,草草几句话就结束了。 而 Grok2 这边,每次给出的答案都挺详细,还贴心地分了类。 反正世超在实际用的时候,是真有感觉到 Grok2 能力的提升。 另外,按照官方给的数据,这次 Grok2 在数学这块儿,也能算得贼溜了。 于是我就又翻出了之前 Grok 做错的那道数学题,是一道求导的问题。 结果马斯克还真没忽悠咱,它俩都把这道题给整明白了。 而把 Grok 奶成现在的模样,马斯克在背后出得力可不止一星半点儿。 但有意思的是,马斯克主打的,就是薅自己其他公司的羊毛…… 先是员工这块儿,xAI 一共就只有 50 来个员工,其中有 11 个都是在特斯拉工作的,而且里面还有 6 个是在 Autopilot 团队工作的,是一点儿都不想避嫌。 据华尔街日报消息,甚至原本要给特斯拉用的 GPU,也被马斯克要求优先供应给 xAI,还冠冕堂皇的说,特斯拉现在也没地儿用,在仓库里放着也是放着。 偷完特斯拉的家,还不过瘾,马斯克把手也伸到了 X 上。 就在前两天,科技媒体 Techcrunch 称,为了 “悄悄” 用用户们的数据训练 AI,X 在更新的时候,还偷摸着把用户的默认设置给改了,而且要关掉还得专门登录网页版…… 不过总这么偷家,难免会吃上官司。像是马斯克和他的 X,就被**特斯拉的股东**,还有**好几个国家的数据保护机构**给起诉了。 目前,关于特斯拉的案件,已经在特拉华州的一个法院审理了。 而另外几个数据保护机构,也把 X 告得,暂停用用户数据训练 Grok 了。甚至 X 还有可能遭到**“4% 平台营业额”**的罚款。 但无论如何,在大模型这块儿,马斯克的 Grok 也算是真正赶上大家伙的进度了。和其他大模型比,不管是图片生成,还是其他基础能力上,Grok2 都不算差,甚至还整出了一点儿自己的特色。 据说,xAI 下一步会把 Grok 更深入地揉到 X 平台上面,而且还要再发一个多模态理解的预览版 AI。 不知道为啥,世超已经有点期待,马斯克还能整出什么花活儿来了…… 资料来源: X、WSJ、Techcrunch ### Related Stocks - [TSLA.US - 特斯拉](https://longbridge.com/zh-CN/quote/TSLA.US.md) ## Related News & Research | Title | Description | URL | |-------|-------------|-----| | Slate pricing to be revealed in June, ‘Blank Slate’ truck still expected in the mid-$20k range | Slate Auto, an EV startup, will reveal pricing for its "Blank Slate" electric pickup in June. The model is expected to b | [Link](https://longbridge.com/zh-CN/news/276367534.md) | | Official Slate Truck Pricing Is Coming In Late June | Slate Auto is set to reveal pricing for its affordable electric pickup truck, the "Blank Slate," in late June. CEO Chris | [Link](https://longbridge.com/zh-CN/news/276389542.md) | | Anthropic Releases Latest A.I. Chatbot Called ‘Claude Sonnet 4.6’ | Anthropic has launched its latest AI chatbot, "Claude Sonnet 4.6," marking its second major release in under two weeks. | [Link](https://longbridge.com/zh-CN/news/276241471.md) | | ANALYSIS-US automakers caught in crossfire of Trump, California EV battle | A legal battle between the Trump administration and California over auto-pollution regulations could have significant fi | [Link](https://longbridge.com/zh-CN/news/276323878.md) | | Tesla’s Giga New York meets state job targets | Tesla's Gigafactory in Buffalo, New York, has met the job requirements of its $1 lease agreement, employing 2,399 full-t | [Link](https://longbridge.com/zh-CN/news/276354184.md) | --- > **免责声明**:本文内容仅供参考,不构成任何投资建议。