数科星球
2023.09.18 03:56

大模型狂飙 垂直模型竞逐 “iphone 时刻

portai
I'm PortAI, I can summarize articles.

“地球上不会一共只有 5 台计算机,而是每个人都会拥有自己的 PC。” 这是微软在 1975 年的预言。
类似的预言,比尔盖茨今年 5 月也做了一次,他认为当前 IT 技术竞赛的最终赢家将是顶级 AI 个人助理,它将颠覆搜索引擎、生产力软件和在线购物网站,“以后人们再也不会去搜索网站了,也永远不会去亚马逊。”

比尔盖茨说的就是以大模型为技术底座的生成式人工智能技术(AIGC)。

事实上,从去年年底开始,由 ChatGPT 引发的 AI 热潮中,大模型始终处于舆论场的中心,可随着用户对写作、绘画等通用大模型能力的新鲜感逐渐退去,试图用 ChatGPT 来解决实际问题时,通常很难获得让人满意的答案。

此时,行业开始从对大模型的技术热情中走出,冷静思考大模型深入到具体行业的落地方向和路径。

一个标志性的事件,8 月 31 日首批大模型通过《生成式人工智能服务管理暂行办法》备案,上线应用开放公众服务后,大大刺激了大模型的落地竞争。

刚刚结束的 2023 世界计算大会,大模型依然是热点,万兴科技宣布即将发布国内首个专注于以视频创意应用为核心的百亿级参数多媒体大模型 “天幕”。

会上,万兴科技还焕新亮相嵌入大模型能力的 10 余款 AI 应用。此外,万兴科技还与湘江实验室正式达成战略合作,助力大模型迭代升级。

 

很显然,万兴科技的这些动作全部围绕着 “落地” 而展开,如果再联想到 7 月份的 WAIC 2023 中,一批基于医疗、金融、教育等垂直行业大模型的发布,我们可以感受到,大模型竞争正进入到落地为王的新阶段。
 

赋能娱乐,还是生产力?大模型应用狂飙到十字路口

谁也不会想到,OpenAI 在去年 11 月 30 日的一次普通发布,直接开启了通向大模型时代的序幕,ChatGPT 的月活仅用两个月就跨越了亿级大关,成为历史上增长最快的消费者应用程序。

对标着 ChatGPT,百度文心一言、阿里通义千问、华为盘古、科大讯飞星火、360 智脑、京东言犀……在很短的时间内,但凡叫得出名字的科技企业都推出了各自的大模型产品。

回顾过往历史,从来没有哪一项新技术能够引发行业集体押注,从业者用 “百模大战” 来形容这一行业盛况。

科技部下属的中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,截至 5 月 28 日,国内规模在 10 亿级参数以上的通用/基础大模型,至少已发布 79 个。我国研发的大模型数量已经排名全球第二。

大模型的数量虽然多,但有相当一部分大模型没有特别好的落地场景,大多停留在陪用户 “写诗、作画” 的阶段。 

在通用大模型的竞争中,厂商们更多是技术能力的展现,由于急于对标 ChatGPT 的能力,过于关注对用户问答的呈现效果,使得大模型更像是作为一项 “娱乐工具” 而存在。

另外一个维度,通用大模型适用的场景有限,当用户尝试用大模型来解决一些实际问题时,往往得不到满意答案,特别是在一些专业性很强的垂直领域,通用大模型很难深入到行业场景中,产生生产力。

ChatGPT 的增长数据很真实的反应了行业对通用大模型的看法。

7 月 4 日,网络分析公司 Similarweb 发布数据称,ChatGPT 6 月份的全球访问量环比降幅 9.7%,独立访客数量环比下滑了 5.7%。

 

除了 ChatCPT,Character.AI 的访问量也在 6 月出现了大幅下滑,环比降幅达 32%。
 

Character.AI 可以模仿娱乐名人、历史人物、虚构人物的人格进行对话,在所有同类 AI 工具中访问量排名第二。

中国工程院院士邬贺铨曾指出,对话、写诗、作画绝不是大模型的全部,“我们需要去深入思考大模型的应用方向,要将大模型切实投入到城市发展、金融科技、生物医药、工业制造、科学研究等领域,也需要专业的企业和组织加速其在实体产业落地,为产业刚需带来实实在在的价值,真正意义大规模服务社会。”

事实上,彭博社今年 3 月推出的金融行业模型 BloomBergGPT,在私有金融任务上显示出垂直大模型优于通用大模型的亮眼表现,在一定程度上也坚定了行业对大模型在垂直行业率先落地的认知。

 

百度董事长李彦宏在 “2023 中关村论坛” 上演讲时表示,未来所有的应用都将基于大模型来开发,每一个行业都会拥有属于自己的大模型,大模型会深度融合到实体经济当中去。
 

万兴科技董事长吴太兵也持类似观点——AI 为创意软件带来前所未有的大机遇。AIGC 时代,大模型作为基础设施将赋能千行百业。如果说 AI 是电力,大模型是三峡水电站一样的大型发电站,那么落地的 AI 应用则是各种电器。大模型时代,应用为王,但大模型可能是 “王后”。万兴科技将首先聚焦应用,时代的 “美的”,同时积极开发升级多媒体大模型,夯实护城河。

如此一来就很好理解了,在通向大模型时代的进程中,通用大模型是基础,是诗与远方;垂直大模型是行业应用,是现实中的柴米油盐,两者的方向虽有不同,但最终的目的地却是一致,如何平衡通用与垂直之间的关系,成为厂商能够最终跑出的关键。


 

“曲线救国” 还是 “应用为王”?大模型商业路径灵魂拷问

其实,无论是通用大模型还是垂直大模型,厂商们的技术能力固然重要,但在当前强调落地的竞争阶段,还是要看由大模型赋能的创新应用到底能不能打,大模型竞争也将进入到去伪存真的过程。

上文提到,通用大模型很难适配到合适的场景,从而实现从技术到应用的落地,但厂商们还是想出了一些 “曲线救国” 的策略。

其一,用大模型来改造自己的现有业务,继续保持与强化基本盘的竞争力。

几个很典型的案例,谷歌、百度用大模型优化自己的搜索产品;阿里表示要用大模型来 “重做” 电商,同时还将大模型的能力融入到钉钉的产品功能中;京东正在实践将大模型的能力用于核心业务中的零售、金融、物流、健康等场景。

其二,以自己的平台能力来输出落地应用,其路径是先 ToC,再 ToB,最终落到具体的行业场景中完成闭环。

由于进入门槛的存在,通用大模型厂商大多为平台型科技巨头,他们依靠着各自的技术专长,分别建立了一套以主营业务为中心的生态体系,这些科技巨头用大模型对自己业务改造的同时,也将大模型的能力融入到各自的生态体系之中。

比如,腾讯依托腾讯云的 TI 平台,打造了一个模型的 “精选商店”,在平台上开放多个模型,企业在选用了合适的模型后,再针对自己的具体需求进行定制化的训练。

比如,百度为了让行业用户也能参与到大模型的建设与应用,搭建企业专属大模型,推出了百度智能云千帆大模型平台,在千帆平台上,用户可以直接调用包括文心一言在内的 42 个大模型服务,也可以在千帆上开发、部署和调用自己的行业大模型。

可以看出,无论是用大模型来改造原有业务,还是用平台能力来输出落地应用,都是建立在对场景理解的基础上,通用大模型如果不 “适用”,那就 “揉碎” 了重新训练,直至适配。

与通用大模型的落地类似,垂直大模型本来就专注于细分行业,其落地同样也建立在对场景的理解上,稍有不同的是,垂直大模型更加侧重于解决具体问题,呈现在用户面前的是一个个具体的应用。

    举个例子,我们在日常生活中,如果遇到一些 “小事”,通常会因为 “性价比” 太低,而不愿意去打官司,美国就出现了一家主要提供针对 “小官司” 的 AI 法律服务公司 DoNotPay。

DoNotPay 利用大模型的能力,将整个法律流程数字化,即便是没有法律知识背景的个人也能操作,并且只收取少量费用。

比如你想停掉健身房的会员费,美国很多地方都缺少人工客服,而且需要很繁琐的手续,但如果用 DoNotPay,就可以找到正确的联系方式,写完备的申斥邮件,帮用户退费。

而这种场景只是 DoNotPay 上百个帮人解决切实痛点的法律场景中的一个而已。

 

万兴科技一直深耕于数字创意软件,其开发的数字人短视频营销工具万兴播爆/Wondershare Virbo,也是结合大模型能力,并精准抓住跨境用户群体痛点,从而受到市场的关注,在很短时间内成为爆款。
 

做跨境业务的企业在开展业务时,经常会要拍摄具有当地特色的营销视频,此时就会遇到外籍演员选择有限、国外取景拍摄沟通执行不便等问题,由此产生制作成本高、时效低的痛点。

万兴播爆/Wondershare Virbo 在产品中内置了涵盖不同肤色和人种的超逼真数字人,并且支持大部分语音,声线风格也可以自由选择,用户只需要几分钟时间就可以快速生成一条营销视频,更关键的是,这个产品的收费标准在绝大多数小 B 客户可以接受的范围之内。其中的数字人播报功能即来自万兴科技自身的大模型能力支撑。

 

此外,在泛知识领域,万兴科技推出了面向教育培训、商务办公场景的 AI 讲演工具万兴智演,并结合大模型能力,上线文生演示文稿;在泛娱乐领域,万兴科技针对文生图、图生图的需求,推出了全球首款交互型 AI 绘画软件万兴爱画,上线 AI 焕新家、AI 换发型等功能。
 

还有一点值得注意,垂直并不代表通用的文本、图片等模型能力不具备。比如万兴 “天幕” 核心是 “视频 + 音频 + 图片”,但会用到文本大模型的专用部分,以助力用户提效文案撰写、脚本输出等。

在行业中,还有很多的 DoNotPay 与万兴科技,他们的实践与探索,给垂直大模型的落地也趟出了一条切实可行的路。


 

奔赴,还是旁观?大模型将成企业分水岭

从 “百模大战” 的竞争,到通用大模型和垂直大模型落地路线的选择,我们看到的是 “智能涌现” 的具象表现,在 “智能涌现” 的背后,大模型正在推动着产业变革的行进以及时代拐点的到来,最有标志性的特征是越来越多企业通过大模型实现了 “价值涌现”。

这里的价值包括两个方面,一个是应用方,通过大模型实现了降本增效,一个是大模型厂商,从中实现了盈利与增收。

对于应用方的前者,上文提到的万兴播爆,不但可以快速生成跨境营销各场景的短视频,还可以将用户制作营销视频的花费节约 80% 以上;

电商场景中营销物料的生成,质量上不会显著低于人工,但成本会降低 1-2 个数量级;

人力资源领域,大模型可以根据 HR 的需求,自动筛选某个岗位的所有简历,大大提升 HR 的工作效率;

编程领域,如今 GitHub 上有 41% 的代码是大模型生成的,这个过程仅用了 6 个月……

对于大模型厂商的后者,Notion 在接入 ChatGPT 之前,只是一款的传统个人笔记软件,可当它的功能与 ChatGPT 融合后,其在博客、会议纪要、工作邮件等场景的应用被大大简洁、高效和强化了,生成的内容只需简单修改就能直接使用。

直接结果就是,Notion 只用了一个月就做到了 1000 万美元 ARR 收入。

万兴科技也是其中的典型代表。

根据不久前发布的半年报显示,万兴科技在报告期内实现营业收入 7.18 亿元,同比增长 32.90%,净利润 4386.89 万元,同比增长 275.06%。

将各项业务进行拆分,视频创意产品线实现营业收入 4.56 亿元,同比增长 41.31%,绘图创意营收同比增长 37%,文档创意产品线同比增长 58.82%。

万兴科技总结公司各项经营数据全面增长的原因时表示为全面拥抱 AIGC 以及订阅转型深化所致。

东吴证券分析师还专门研究了万兴播爆等产品的市场前景,他们认为,就像 2013 年移动互联网时期的脸萌一样,在新技术爆发早期,创意软件工具能精准切入用户真实生活、工作场景,低成本、高质量地解决实际需求,用户使用意愿强劲,未来商业模式及商业机会仍有许多值得探讨的空间。 

需要特别指出的是,当前的大模型能力更多集中在文本语言方面,专注于图片、视频创意应用的多媒体大模型却很少,但市场对这方面需求却很旺盛。

    来自研究机构 Market.us 的数据显示,2022 年全球 AI 视频生成工具的市场规模为 4.15 亿美金,预计到 2032 年将达到 21.72 亿美金,未来 10 年的市场规模年复合增速可达 18.5%。

   Sensor Tower 数据也显示,23H1 全球 AI 应用下载量同比增长超过 114%,突破 3 亿次,已超出去年全年水平。该数据证明,技术加码已经为 AI 应用带来新量级的消费者的关注和喜爱。

 

 一个更宏观的视角,大模型催生了诸多机会,也迸发出强大的发展势能,为布局的企业带来更大想象空间,这些企业既可借力大模型率先完成产品与业务形态的进化,还将一定程度推动各自所在行业飞轮的快速转动。
 

反面来看,正如 AI 无法取代人工,但未来不会使用 AI 的人或将被淘汰;大模型无法取代现有的数字基础设施,但未来不应用大模型的企业或将被淘汰。$Wondershare(300624.SZ)

The copyright of this article belongs to the original author/organization.

The views expressed herein are solely those of the author and do not reflect the stance of the platform. The content is intended for investment reference purposes only and shall not be considered as investment advice. Please contact us if you have any questions or suggestions regarding the content services provided by the platform.