智谱AI发布GLM-5.1旗舰模型:长工程能力全球领先,国产算力自主可控

      2026年4月7日,智谱AI(Z.ai)正式发布新一代旗舰开源大模型 GLM-5.1。作为全球首个实现8小时连续自主工作的开源大模型,其在权威编程基准SWE-bench Pro中以58.4%的成绩超越GPT-5.4(57.7%)与Claude Opus 4.6(57.3%),登顶全球开源模型榜首,标志着中国大模型在长程智能体工程领域实现关键跨越。


一、核心定位:从“交互助手”到“自治工程师”


      GLM-5.1定位为面向复杂系统工程、长程智能体任务的旗舰基座模型,核心突破“单次交互、短时响应”局限,具备完整规划—执行—调试—迭代全流程自主闭环,可独立完成超大规模、高复杂度的企业级工程任务。


二、核心技术参数(权威官方)


      模型架构为744B参数MoE(混合专家)架构,单次推理仅激活40–44B参数,兼顾性能与效率;训练算力全程基于华为昇腾910B芯片(10万片集群)、MindSpore框架训练,未使用任何英伟达GPU,实现纯国产算力自主可控;上下文窗口达200K tokens(约15万字),最大输出128K tokens;训练数据涵盖28.5T tokens高质量代码与工程数据;采用MIT License开源协议,完全开源、支持商用、可本地部署;推理成本仅为Claude Opus 4.6的1/5–1/8,输入$1.00/百万token、输出$3.20/百万token,整体成本降低约97%。


三、三大核心能力突破(企业级价值)


1. 长程自治能力:8小时无人干预,完成全链路工程
GLM-5.1单次任务可稳定执行8小时以上,完成1200–1700步连续操作。典型应用案例包括:8小时从零构建完整Linux桌面系统(含窗口管理器、状态栏、VPN、中文字体、游戏库),自动回归测试全通过;7小时42分重构企业级检索系统,性能提升6倍,全程无人工干预;655轮自主迭代优化向量数据库,查询吞吐提升10倍。
2. 代码工程能力:全球顶级,开源第一
该模型在SWE-bench Pro评测中取得58.4%的优异成绩,位列全球第三、开源第一,超越GPT-5.4与Claude Opus 4.6。支持Python/C++/Java/Rust/Go等全栈开发语言,覆盖架构设计、前后端、数据库、DevOps、测试自动化等全流程开发环节,同时可自动解析、迁移、优化老旧代码,将遗留系统重构周期缩短50%以上。
3. 企业级适配:安全、可控、低成本

GLM-5.1全面兼容昇腾910B/950训练与推理环境,完美适配国产化IT架构;部署方式灵活多样,支持云端API、私有化部署,后续还将推出7B/14B轻量化版本,适配边缘端场景;同时满足数据不出域、审计可追溯的要求,符合国内AI安全管理规范,保障企业应用安全合规。


四、企业级应用场景


      在软件开发领域,可实现全栈代码生成、项目架构设计、自动化测试、缺陷修复等功能,帮助企业降低40%以上人力成本;在系统运维方面,能够完成服务器配置、环境部署、漏洞排查、日志分析、性能调优等工作;在数据工程领域,可提供SQL优化、ETL开发、向量数据库构建、数据治理等服务;此外,还广泛应用于科研创新(算法原型、仿真代码、文献解析、实验自动化)、工业/制造(工业软件二次开发、设备控制程序、产线优化)等多个领域。

      依托GLM-5.1的强大基座能力,我司自研九章AI智能体应用平台同步实现能力升级,为企业提供全场景智能体落地解决方案。该平台后台全面支持RAG、MCP、Skill等核心技术,可灵活对接企业现有业务系统,深度贴合企业自身业务流程,快速打造适配专属业务场景的定制化智能体。目前,平台已预置项目协同、合同审查、人员能力提升、售后维修等多款成熟智能体应用,实现开箱即用,无需额外开发,助力企业快速落地AI能力、提升运营效率。


五、行业意义与价值


      GLM-5.1作为全球首个纯国产算力训练的700B+顶级模型,打破了“无英伟达不顶尖”的技术封锁,成为国产AI发展的重要里程碑;实现了从“AI辅助”到“AI自治工程”的范式跃迁,让大模型真正成为企业核心生产力;顶级能力与97%的成本下降形成双重优势,加速了AI在企业核心场景的规模化落地;同时,MIT协议的开放模式,助力中国企业构建自主可控、安全合规的AI技术体系。


六、官方与生态信息


      该模型于2026年4月7日正式发布,官方文档可登录智谱AI开放平台查看,开源地址分布于Hugging Face、始智AI wisemodel社区;针对企业用户,智谱AI还提供私有化部署、定制微调、技术支持、安全合规解决方案等一站式企业服务。