中国电信星辰AI大模型开源第A8版:信创 20240116期中国工业报

    1月10日，中国电信宣布星辰AI大模型全面开源。这表明中国电信自研大型模型能力的成熟，也展示了其在落地应用和拓展服务方面的实力。目前，中国电信星辰AI大模型通过Github、Gitee及Huggingface平台面向全社会开源，公开其底层代码、算法逻辑及其预制的各种基础大模型、开发模块、训练工具等核心产品能力。用户既可以直接调用大模型，也可以根据自身业务需求对大模型进行微调或个性化设置，或者加载自己的知识库或数据，从而调整出更符合自身业务需求、更加个性化的理想结果。
   近几年来，中国电信在人工智能技术方向持续发力，成立中电信人工智能科技有限公司，邀请人工智能领域科学家李学龙牵头组建更高水平的人工智能研发队伍，推动大模型的技术发展与应用落地。
   中国电信打造出具有强大特征学习能力与跨领域泛化能力的星辰系列大模型，构建了语义、语音、视觉及多模态大模型完备的基础框架。其中语义大模型于2023年11月份发布千亿参数版本，在大模型知名榜单CSL排名第五、GAOKAO排名第七、AGIEval排名第八。视觉大模型赋能100+城市治理下游任务，算法日均调用量达3.3亿次；多模态大模型聚焦图文生成和图文理解能力，采集超过12亿的风格数据，文图检索精度达到SOTA，支持20+风格生成。语音大模型可实现高精度多方言的语音识别以及多语种、多风格、多音色的语音合成。与此同时，中国电信星辰系列大模型在覆盖视觉、语义、语音等多模态领域的20项国内外权威竞赛中斩获多项大奖。
   中国电信星辰语义大模型在业界首次提出缓解多轮幻觉的解决方案，“幻觉率”降低40%，同时以稳定、多样的大模型底座支撑及多样化工具辅助，支持丰富多元的应用场景。开发星辰语音大模型和星辰多模态生成式大模型，以更高效的训练、更精准的理解、更丰富的想象和更方便的控制，赋能数字化应用。
   中国电信新一代3D数字人生成技术实现了分钟级全自动3D重建及骨骼蒙皮的自适应迁移，3D顶点平均误差小于1mm，只需要几张照片就可以快速生成自己的超写实3D数字人，高度还原了面部形状、褶皱、五官形状、皮肤纹理等细节。在该技术下3D数字人制作时间可从1个月缩短至3天，人工参与步骤相比原来减少80%。同时自研了一套半自动拓扑绑定流程，可精细到眼角、嘴角级稳定拓扑，支持微表情级的动作表达。最终结合自研的驱动引擎和渲染引擎，让数字人在动作及情绪表达上有更多的可能性。
   一站式智算服务平台 “慧聚”，通过构建一站式全链路的大模型流水线，为加速大模型的生产应用提供强劲动能。“慧聚”平台成功突破了技术难点，实现了稳定性、训练推理速度等核心指标大幅提升。 “慧聚”平台包含数据准备、模型开发、任务管理、模型优化等多个产品功能模块，帮助用户打造针对不同场景的专属工具集。
   此前，中国电信数据发展中心携手海南省大数据管理局、襄阳市人民政府等12个合作单位和企业发起数据要素生态联盟，加速释放数据价值，共同推动人工智能探索进程。中国电信还联合头部生态机构，依托基础大模型，构建了涵盖教育、政务、应急等20多个行业大模型，覆盖全行业500多个应用场景，有效满足了各行各业对人工智能技术的多样化需求。
（海文）