重构生态大模型商业化进阶加速第A1版:要闻 20240528期中国工业报

    ■ 中国工业报王永强
   在被媒体称为 “打响大模型市场价格战第一枪”后不到一周，字节跳动豆包大模型就又被阿里云的降价 “掀了桌子”。
   5月21日，阿里云宣布通义千问主力模型Qwen-Long直降97%（0.0005元/千to-kens）。降价后，阿里通义模型约为GPT-4价格的1/400，击穿全球tokens（GPT文本中最小的独立部分）底价的同时，较之5月15日豆包大模型的0.0008元/千tokens，价格又降了30%以上。
   当然，降价混战这种事情，在国内当下就有117家备案大模型厂商的情况下，没有谁能置身事外。何况，全球大模型技术先行者OpenAI，在GPT-4o技术迭代放缓、难言现象级提升的情况下，2023年年初以来已降价4次。
   “除了大厂（外），中美加起来应该可以支撑五六家（大模型）左右。”2023年12月，零一万物创始人李开复的预测言犹在耳，“百模”混战淘汰赛已拉开序幕。而相较于大模型创业公司的筚路蓝缕，巨头们率先掀起的 “价格战”，其醉翁之意不在 “降价”本身，做大市场、繁荣生态、提升集中度，或是其本意。
“跟”与 “不跟”
   中国大模型与美国大模型的差距从一年多前落后7-10年缩小到6个月，差距大幅降低。考虑到现在大模型的API（应用程序接口）调用比例还非常低，如果推理成本一年降低90%可以让更多人用上大模型，这是非常利好的消息。
   截至5月22日，大模型 “降价”混战已经集齐当下主要厂商。
   5月22日，腾讯云将主力模型之一的混元-lite模型调整为全面免费；万亿参数模型混元-pro，API（应用程序编程接口）输入价格从0.1元/千tokens降至0.03元/千tokens，降幅达70%。
   同日，大模型 “国家队”科大讯飞（002230.SH）也发布公告，宣布讯飞星火API能力正式免费开放。其中，讯飞星火LiteAPI永久免费开放，讯飞星火Pro/MaxAPI低至0.21元/万tokens。
   此前的5月21日，百度宣布文心大模型的两款主力模型ENIRESpeed、ENIRELite即刻起全面免费，开启大模型API调用的 “免费时代”。百度相关负责人还特意强调称，这两款模型支持128k、8k上下文长度，是目前百度文心大模型系列中服务用户最多的模型型号。
   而作为价格战的 “始作俑者”，5月15日，字节跳动旗下火山引擎宣布升级火山方舟、应用服务、机器学习平台、云底座的同时，一口气发布9款大模型，并巨幅调降大模型调用价格：豆包pro32k模型推理输入定价降至0.0008元/千tokens，较同业价格 “断崖式”下降99.3%；豆包pro128k模型正式定价0.005元/千tokens，较同业价格低95.8%。
   至此，大模型市场份额居先的阿里、百度和字节跳动全部入局大模型 “价格战”。
   而如果考虑到大模型 “五小龙” （智谱AI、百川智能、Minimax、月之暗面、零一万物）中，智谱AI早在5月11日就宣布了降价，将入门级大模型GLM-3-Turbo（上下文长度128k）的价格从0.005元/千tokens降低到0.001元/千to-kens，开放平台新注册用户获赠从500万tokens提升至2500万tokens（包含2000万入门级额度和500万企业级额度），则本次大模型降价潮已覆盖国内主要大模型厂商。
   当然，与巨头们的 “财大气粗”不同，大模型创业公司面对 “价格战”相对理性。《证券时报》报道称，李开复、百川智能创始人兼CEO王小川均表示不会跟进降价。
   李开复表示，中国大模型与美国大模型的差距从一年多前落后7~10年缩小到6个月，差距大幅降低。考虑到现在大模型的API（应用程序接口）调用比例还非常低，如果推理成本一年降低90%可以让更多人用上大模型，这是非常利好的消息。
   但另一方面，如果大模型公司认定自己的技术值得，就会坚持一个合适的价格，而绝不会靠贴钱、赔钱去做生意。因此，零一万物Yi-Large模型20元100万tokens的定价，目前还没有调整打算。
   王小川则认为，价格免费是优势，但不一定是竞争力。百川智能并不会参与到价格战当中，因为ToB不是公司的主要商业模式，价格战的影响有限，公司会将更多的精力放在超级应用当中。
水大鱼大
   降价策略成为各大模型厂商吸引客户、推动大模型普及的关键手段。此举不仅有助于激发更多用户尝试和应用大模型，还预示着市场潜力的巨大释放。
   与李开复、王小川的说法有共识，火山引擎总裁谭待在受访中亦公开表示，“（豆包降价）一是能做到，二是需要这么做。主力模型比行业便宜99.3%在技术上可实现，未来还有很多手段降低成本。”豆包分布式推理还有混合调度，通过发挥各种各样的异构算力解决了推理算力问题，进而可以把模型推理的成本降到很低。
   “以前企业做创新担心ROI（投资回报率）打不正，一来创新项目90%会失败，二来创新按消耗100亿Tokens算就要80万元；现在成本只需要8000元，失败也花不了多少钱，但剩下10%项目成功就可以把投入都赚回来，这无疑能帮助更多企业轻装上阵，无负担投身AI大潮。”谭待说。
   也正是基于此，在字节跳动跨过模型效果、推理成本、落地难度三道基本门槛后，把 “蛋糕做大”成了火山引擎举起价格 “屠刀”的根本用意所在。
   “对于大模型创业者来说，没有哪家能靠ToB业务赚很多钱，或者认为通过ToB服务把自己的大模型商业模式实现正循环是此路不通。而现在还是大模型创业早期的阶段，池塘大鱼才大，要把蛋糕做大先要做到普惠，让很多企业能以更低成本做各种创新，这是更重要的。”谭待称。
   与谭待的醉翁之意不在 “降价”相同，阿里云的降价则既有 “看破就跟进”的 “默契”，也有更为现实的商业竞争层面考量。
   阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示： “作为中国第一大云计算公司，阿里云这次大幅降低大模型推理价格，就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。”
   “大模型市场正处于蓬勃发展的黄金时期，其应用前景广阔，尚待进一步挖掘和繁荣。目前，降价策略成为各大模型厂商吸引客户、推动大模型普及的关键手段。此举不仅有助于激发更多用户尝试和应用大模型，还预示着市场潜力的巨大释放。”东吴计算机首席分析师王紫敬告诉中国工业报，“与此同时，各大模型厂商在技术领域的卓越持续创新能力，不断突破成本降低的极限。这不仅展现了它们对市场发展的坚定信心，更能为客户带来实实在在的利益。”
   “尤其值得一提的是，对于既是模型厂商又是云服务提供商的企业而言，大模型降价更是成为拉动云消费的强大引擎。随着大模型应用的广泛普及，用户对云资源的需求也将持续增长，这将进一步推动云市场的繁荣。”王紫敬表示。
   国际咨询机构Gartner于5月初发布的最新云计算市场追踪数据报告显示，2023年，阿里云在亚太地区云计算IaaS市场排名第一，市场份额为22.2%，较2022年21.4%的市场份额仅微增；华为、腾讯的2023年亚太云市场份额则分别位居第四、第五位，11.2%、6.9%的市占分别较2022年的11.6%、7.5%略降。
   正是基于争夺市场份额的考虑，2024年3月1日开始，阿里云开启了新一轮降价政策，核心产品价格全线下调，平均降幅20%，最高降幅度达55%。此次大模型的降价，不过是阿里云降价风暴的 “战线”延续。
生态之争
   大模型的成败更多取决于其在各种实际场景中的应用效果和实用性，率先落地并建立起良好表现的大模型企业，无疑会获得先发优势。
   事实上，“百模”混战之所以一触即发，与移动互联网业到了用户、流量趋于见顶的成熟期，大模型技术成为各家巨头平台及生态重构的关键息息相关。
   豆包大模型发布会现场，火山引擎即宣布与众多汽车、手机厂商成立联盟。其中，火山引擎联合中国电动汽车百人会，与吉利汽车、长城汽车、捷途汽车、赛力斯、智己汽车等20余家厂商宣布成立汽车大模型生态联盟，与OPPO、vivo、荣耀、小米、三星、华硕宣布成立智能终端大模型联盟。OPPO小布助手、荣耀MagicBook的YOYO助理、小米 “小爱同学”、华硕笔记本电脑的豆叮AI助手等应用，均已接入火山引擎的大模型服务。
   而阿里云亦认为，不管是开源模型还是商业化模型，公共云+API将成为企业使用大模型的主流方式，这将为阿里云的营收带来更大想象空间。
   刘伟光以企业大模型的调用成本对比称，公共云的技术红利和规模效应，已大幅压缩了模型推理成本，并加快模型推理速度：“即便是同样的开源模型，在公共云上的调用价格也远远低于私有化部署。以使用Qwen-72B开源模型、每月1亿tokens用量为例，在阿里云百炼上直接调用API每月仅需600元，私有化部署的成本平均每月超1万元。”
   “云上更方便进行多模型调用，并提供企业级的数据安全保障。阿里云可以为每个企业提供专属VPC（虚拟私有云）环境，做到计算隔离、存储隔离、网络隔离、数据加密，充分保障数据安全。目前，阿里云已主导或深度参与10多项大模型安全相关国际国内技术标准的制定。”刘伟光表示。
   “大模型发展的真正挑战并不在于价格的高低，而在于下游应用场景的明确性和落地能力。大模型的成败更多取决于其在各种实际场景中的应用效果和实用性，率先落地并建立起良好表现的大模型企业，无疑会获得先发优势。其他大模型企业则可以凭借独特的数据资源、算法优势，在其他场景或细分、专用领域中展现出更好性能，以形成比较优势。”王紫敬告诉中国工业报。
   正是基于上述共识，百度、科大讯飞等在大模型的生态搭建和场景拓展上不遗余力。
   4月中旬的Create2024百度AI开发者大会上，百度创始人李彦宏表示：“AI正在掀起一场创造力革命，未来开发应用就像拍个短视频一样简单，人人都是开发者，人人都是创造者。”为此，百度对外提供的开发工具箱，包括了1个强大的基础模型系列和三大AI开发工具，支持开发者打包带走，随取随用。
   百度集团副总裁、百度智能驾驶事业群组（IDG）负责人王云鹏也在上任后的首封内部信中提及，要用大模型重构自动驾驶技术栈，百度将完成自动驾驶基础模型（AD-FM）的构建，并重构技术和产品。
   科大讯飞董事长刘庆峰在2月的公司内部年会上，提出了讯飞大模型战略的2024年度四大目标：底座大模型领先，星火通用大模型国内领先对标GPT-4；赋能软硬件产品，赋能智能硬件终端1000万、独立软件用户数过亿；行业应用领先，教育、医疗、金融、汽车等领域市场第一；开发者生态领先，汇聚100万开发者形成行业第一生态。
   “大模型的发展确实呈现出显著的飞轮效应，预示着未来的大模型行业将趋向寡头垄断的竞争格局。”王紫敬告诉中国工业报， “阿里和字节的价格竞争，更多还是考虑大模型发展本身，这应该是未来厂商之间持续竞争的一次缩影、一次揭幕。”