优刻得星图AstraFlow首发上线智谱GLM-5.2,优云智算Coding Plan也同步上线。GLM-5.2是面向长任务时代的旗舰模型,支持真正可用的1M上下文,可承载项目级工程上下文,长程任务执行更稳定、工程规范遵循更可靠,一次任务即可完成从需求到多端部署的完整开发链路。

图片

在全球百万用户参与盲测的前端开发评估系统Code Arena上,GLM-5.2取得全球可用模型第一的表现。

图片

1M上下文与长程任务

支撑长程任务的第一步是GLM-5.2必须实现1M无损上下文。此前1M上下文大多数在超过数百K过后就开始劣化,主要问题在于不同时增强Coding Agent环境及数据的情况下单纯扩展到1M帮助有限。GLM-5.2真正扩展到了1M Coding Agent的训练环境,覆盖自动化研究、性能优化等多个领域,在1M上下文的solid表现有时甚至超过Opus。

1M上下文构成GLM-5.2的长程交付能力,多个长程任务基准表明GLM-5.2的表现介于Claude Opus 4.7与4.8之间,是排名最高的开源模型。在FrontierSWE(测试AI是否能够像软件工程师在数小时尺度上完成复杂技术项目的测试集)上仅比Opus 4.8低1%,超过GPT-5.5(1%)和Opus 4.7(11%);不过在SWE-Marathon(考察Agent自主完成超长软件工程的测试集)上确实还需要进一步提高,低于Opus 4.8不少(13%)。

图片

在实际体验中,GLM-5.2完成开发、联调、测试到打包上线,完整交付一个覆盖Web、移动端与小程序的多端应用,累计处理88万tokens,几乎用满1M上下文窗口。过去,这样的大型工程需要一支团队协作数周,现在GLM-5.2能在一次长程任务中跑完。

更强的Coding能力

GLM-5.2在前端、后端、长程任务上的成功率相比前一代GLM-5.1都有提升,复杂系统工程与深度调试更稳。在主流编程基准上,GLM-5.2保持开源SOTA,与Claude Opus 4.8处于可比区间。例如在Terminal-Bench 2.1(评测AI Agent完成不同类型的计算机终端任务),GLM-5.2比Opus 4.8低4%,相比GLM-5.1提升了17.5%;在MCP-Atlas(大规模工具调研评测的数据集),GLM-5.2比Opus 4.8低0.8%。

图片

GLM-5.2的最大提升集中在:

  • 项目级上下文承载更强,能把完整工程放进同一条推理链路里

  • 长程任务执行更稳定,复杂任务能持续推进,不容易中途跑偏

  • 生产级工程规范遵循更可靠,能守住团队研发流程里的硬约束

  • 客户端与移动端工程能力更扎实,不止写App,还能完成真机调试闭环

GLM-5.2还引入了effort level(思考档位)控制,可以在能力、速度、成本之间做出平衡。在相近的token预算下,GLM-5.2的Coding能力大致位于Claude Opus 4.7与Claude Opus 4.8之间。

图片

极致Infra优化

GLM-5.2的进步来自模型架构、推理系统和训练基础设施的协同设计,提出了IndexShare,在每四层稀疏注意力层之间复用同一个索引器(indexer),在1M上下文长度下,将单位token的FLOPs降低至2.9倍。此外,改进了用于投机解码(speculative decoding)的MTP层,将接受长度(acceptance length)最多提升20%。训练侧则依赖自研Slime框架支撑大规模Agentic RL和OPD训练。

图片

随着GLM系列的持续迭代与调用量的快速增长,线上服务的稳定性与效率愈发关键。GLM-5.2的线上推理依托多个国产算力平台,已在Day 0完成与华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞等国产算力平台的推理适配,在国产芯片集群上实现高吞吐、低延迟、大并发的稳定运行。

登录AstraFlow星图 限时免费体验

优刻得AI开发平台星图AstraFlow构建了覆盖“模型供给—开发调度—安全运行—成本管理”的全链路能力体系,持续跟进最新优质模型动态,实现Day0级别极速上新。作为AI应用开发者,无需关注底层的算力资源调度、基础环境的模型部署,即可快速搭建专属AI应用。

调用步骤:

步骤一:注册并登录AstraFlow星图

平台地址:https://astraflow.ucloud.cn/

步骤二:实名认证

使用服务前用户需要完成实名认证。

步骤三:创建API Key

进入模型服务平台-秘钥管理。

平台地址:

https://astraflow.ucloud.cn/modelverse/api-keys

点击左上角创建一个Key,新用户注册免费50万tokens。

curl -X POST "https://api.modelverse.cn/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer your-api-key" \
-d '{
  "model": "glm-5.2",
  "messages": [
    {
      "role": "system",
      "content": "你是一名资深的全栈软件工程师,擅长前端开发、后端架构设计以及现代 Web 技术栈"
    },
    {
      "role": "user",
      "content": "帮我设计并编写一个个人博客网站,包含首页、文章列表、文章详情页,使用 React + Node.js 技术栈"
    }
  ],
  "thinking": {
    "type": "enabled"
  },
  "reasoning_effort": "max",
  "stream": true,
  "max_tokens": 65536,
  "temperature": 1.0
}'

优刻得算力云平台优云智算Coding Plan订阅套餐也已同步上线GLM-5.2。

登录体验:https://www.compshare.cn/coding-plan

Logo

作为“人工智能6S店”的官方数字引擎,为AI开发者与企业提供一个覆盖软硬件全栈、一站式门户。

更多推荐