重构生态 大模型商业化进阶加速
■ 中国工业报 王永强 在被媒体称为 “打响大模型市场价格战第一枪”后不到一周,字节跳动豆包大模型就又被阿里云的降价 “掀了桌子”。 5月21日,阿里云宣布通义千问主力模型Qwen-Long直降97%(0.0005元/千to-kens)。降价后,阿里通义模型约为GPT-4价格的1/400,击穿全球tokens(GPT文本中最小的独立部分)底价的同时,较之5月15日豆包大模型的0.0008元/千tokens,价格又降了30%以上。 当然,降价混战这种事情,在国内当下就有117家备案大模型厂商的情况下,没有谁能置身事外。何况,全球大模型技术先行者OpenAI,在GPT-4o技术迭代放缓、难言现象级提升的情况下,2023年年初以来已降价4次。 “除了大厂 (外),中美加起来应该可以支撑五六家 (大模型)左右。”2023年12月,零一万物创始人李开复的预测言犹在耳,“百模”混战淘汰赛已拉开序幕。而相较于大模型创业公司的筚路蓝缕,巨头们率先掀起的 “价格战”,其醉翁之意不在 “降价”本身,做大市场、繁荣生态、提升集中度,或是其本意。 “跟”与 “不跟” 中国大模型与美国大模型的差距从一年多前落后7-10年缩小到6个月,差距大幅降低。考虑到现在大模型的API(应用程序接口)调用比例还非常低,如果推理成本一年降低90%可以让更多人用上大模型,这是非常利好的消息。 截至5月22日,大模型 “降价”混战已经集齐当下主要厂商。 5月22日,腾讯云将主力模型之一的混元-lite模型调整为全面免费;万亿参数模型混元-pro,API(应用程序编程接口)输入价格从0.1元/千tokens降至0.03元/千tokens,降幅达70%。 同日,大模型 “国家队”科大讯飞(002230.SH)也发布公告,宣布讯飞星火API能力正式免费开放。其中,讯飞星火LiteAPI永久免费开放,讯飞星火Pro/MaxAPI低至0.21元/万tokens。 此前的5月21日,百度宣布文心大模型的两款主力模型ENIRESpeed、ENIRELite即刻起全面免费,开启大模型API调用的 “免费时代”。百度相关负责人还特意强调称,这两款模型支持128k、8k上下文长度,是目前百度文心大模型系列中服务用户最多的模型型号。 而作为价格战的 “始作俑者”,5月15日,字节跳动旗下火山引擎宣布升级火山方舟、应用服务、机器学习平台、云底座的同时,一口气发布9款大模型,并巨幅调降大模型调用价格:豆包pro32k模型推理输入定价降至0.0008元/千tokens,较同业价格 “断崖式”下降99.3%;豆包pro128k模型正式定价0.005元/千tokens,较同业价格低95.8%。 至此,大模型市场份额居先的阿里、百度和字节跳动全部入局大模型 “价格战”。 而如果考虑到大模型 “五小龙” (智谱AI、百川智能、Minimax、月之暗面、零一万物)中,智谱AI早在5月11日就宣布了降价,将入门级大模型GLM-3-Turbo(上下文长度128k)的价格从0.005元/千tokens降低到0.001元/千to-kens,开放平台新注册用户获赠从500万tokens提升至2500万tokens(包含2000万入门级额度和500万企业级额度),则本次大模型降价潮已覆盖国内主要大模型厂商。 当然,与巨头们的 “财大气粗”不同,大模型创业公司面对 “价格战”相对理性。《证券时报》报道称,李开复、百川智能创始人兼CEO王小川均表示不会跟进降价。 李开复表示,中国大模型与美国大模型的差距从一年多前落后7~10年缩小到6个月,差距大幅降低。考虑到现在大模型的API(应用程序接口)调用比例还非常低,如果推理成本一年降低90%可以让更多人用上大模型,这是非常利好的消息。 但另一方面,如果大模型公司认定自己的技术值得,就会坚持一个合适的价格,而绝不会靠贴钱、赔钱去做生意。因此,零一万物Yi-Large模型20元100万tokens的定价,目前还没有调整打算。 王小川则认为,价格免费是优势,但不一定是竞争力。百川智能并不会参与到价格战当中,因为ToB不是公司的主要商业模式,价格战的影响有限,公司会将更多的精力放在超级应用当中。 水大鱼大 降价策略成为各大模型厂商吸引客户、推动大模型普及的关键手段。此举不仅有助于激发更多用户尝试和应用大模型,还预示着市场潜力的巨大释放。 与李开复、王小川的说法有共识,火山引擎总裁谭待在受访中亦公开表示,“(豆包降价)一是能做到,二是需要这么做。主力模型比行业便宜99.3%在技术上可实现,未来还有很多手段降低成本。”豆包分布式推理还有混合调度,通过发挥各种各样的异构算力解决了推理算力问题,进而可以把模型推理的成本降到很低。 “以前企业做创新担心ROI(投资回报率)打不正,一来创新项目90%会失败,二来创新按消耗100亿Tokens算就要80万元;现在成本只需要8000元,失败也花不了多少钱,但剩下10%项目成功就可以把投入都赚回来,这无疑能帮助更多企业轻装上阵,无负担投身AI大潮。”谭待说。 也正是基于此,在字节跳动跨过模型效果、推理成本、落地难度三道基本门槛后,把 “蛋糕做大”成了火山引擎举起价格 “屠刀”的根本用意所在。 “对于大模型创业者来说,没有哪家能靠ToB业务赚很多钱,或者认为通过ToB服务把自己的大模型商业模式实现正循环是此路不通。而现在还是大模型创业早期的阶段,池塘大鱼才大,要把蛋糕做大先要做到普惠,让很多企业能以更低成本做各种创新,这是更重要的。”谭待称。 与谭待的醉翁之意不在 “降价”相同,阿里云的降价则既有 “看破就跟进”的 “默契”,也有更为现实的商业竞争层面考量。 阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示: “作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。” “大模型市场正处于蓬勃发展的黄金时期,其应用前景广阔,尚待进一步挖掘和繁荣。目前,降价策略成为各大模型厂商吸引客户、推动大模型普及的关键手段。此举不仅有助于激发更多用户尝试和应用大模型,还预示着市场潜力的巨大释放。”东吴计算机首席分析师王紫敬告诉中国工业报,“与此同时,各大模型厂商在技术领域的卓越持续创新能力,不断突破成本降低的极限。这不仅展现了它们对市场发展的坚定信心,更能为客户带来实实在在的利益。” “尤其值得一提的是,对于既是模型厂商又是云服务提供商的企业而言,大模型降价更是成为拉动云消费的强大引擎。随着大模型应用的广泛普及,用户对云资源的需求也将持续增长,这将进一步推动云市场的繁荣。”王紫敬表示。 国际咨询机构Gartner于5月初发布的最新云计算市场追踪数据报告显示,2023年,阿里云在亚太地区云计算IaaS市场排名第一,市场份额为22.2%,较2022年21.4%的市场份额仅微增;华为、腾讯的2023年亚太云市场份额则分别位居第四、第五位,11.2%、6.9%的市占分别较2022年的11.6%、7.5%略降。 正是基于争夺市场份额的考虑,2024年3月1日开始,阿里云开启了新一轮降价政策,核心产品价格全线下调,平均降幅20%,最高降幅度达55%。此次大模型的降价,不过是阿里云降价风暴的 “战线”延续。 生态之争 大模型的成败更多取决于其在各种实际场景中的应用效果和实用性,率先落地并建立起良好表现的大模型企业,无疑会获得先发优势。 事实上,“百模”混战之所以一触即发,与移动互联网业到了用户、流量趋于见顶的成熟期,大模型技术成为各家巨头平台及生态重构的关键息息相关。 豆包大模型发布会现场,火山引擎即宣布与众多汽车、手机厂商成立联盟。其中,火山引擎联合中国电动汽车百人会,与吉利汽车、长城汽车、捷途汽车、赛力斯、智己汽车等20余家厂商宣布成立汽车大模型生态联盟,与OPPO、vivo、荣耀、小米、三星、华硕宣布成立智能终端大模型联盟。OPPO小布助手、荣耀MagicBook的YOYO助理、小米 “小爱同学”、华硕笔记本电脑的豆叮AI助手等应用,均已接入火山引擎的大模型服务。 而阿里云亦认为,不管是开源模型还是商业化模型,公共云+API将成为企业使用大模型的主流方式,这将为阿里云的营收带来更大想象空间。 刘伟光以企业大模型的调用成本对比称,公共云的技术红利和规模效应,已大幅压缩了模型推理成本,并加快模型推理速度:“即便是同样的开源模型,在公共云上的调用价格也远远低于私有化部署。以使用Qwen-72B开源模型、每月1亿tokens用量为例,在阿里云百炼上直接调用API每月仅需600元,私有化部署的成本平均每月超1万元。” “云上更方便进行多模型调用,并提供企业级的数据安全保障。阿里云可以为每个企业提供专属VPC(虚拟私有云)环境,做到计算隔离、存储隔离、网络隔离、数据加密,充分保障数据安全。目前,阿里云已主导或深度参与10多项大模型安全相关国际国内技术标准的制定。”刘伟光表示。 “大模型发展的真正挑战并不在于价格的高低,而在于下游应用场景的明确性和落地能力。大模型的成败更多取决于其在各种实际场景中的应用效果和实用性,率先落地并建立起良好表现的大模型企业,无疑会获得先发优势。其他大模型企业则可以凭借独特的数据资源、算法优势,在其他场景或细分、专用领域中展现出更好性能,以形成比较优势。”王紫敬告诉中国工业报。 正是基于上述共识,百度、科大讯飞等在大模型的生态搭建和场景拓展上不遗余力。 4月中旬的Create2024百度AI开发者大会上,百度创始人李彦宏表示:“AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”为此,百度对外提供的开发工具箱,包括了1个强大的基础模型系列和三大AI开发工具,支持开发者打包带走,随取随用。 百度集团副总裁、百度智能驾驶事业群组(IDG)负责人王云鹏也在上任后的首封内部信中提及,要用大模型重构自动驾驶技术栈,百度将完成自动驾驶基础模型 (AD-FM)的构建,并重构技术和产品。 科大讯飞董事长刘庆峰在2月的公司内部年会上,提出了讯飞大模型战略的2024年度四大目标:底座大模型领先,星火通用大模型国内领先对标GPT-4;赋能软硬件产品,赋能智能硬件终端1000万、独立软件用户数过亿;行业应用领先,教育、医疗、金融、汽车等领域市场第一;开发者生态领先,汇聚100万开发者形成行业第一生态。 “大模型的发展确实呈现出显著的飞轮效应,预示着未来的大模型行业将趋向寡头垄断的竞争格局。”王紫敬告诉中国工业报, “阿里和字节的价格竞争,更多还是考虑大模型发展本身,这应该是未来厂商之间持续竞争的一次缩影、一次揭幕。”
|