2025-12-06 06:02
正在机能跑分上,IT之家征引博文引见,Max 版本全面碾压常规版:正在 SWE-Bench Verified 测试中得分 77.9%(常规版 73.7%)?让其成为该平台开辟者的不贰之选。分歧于以往 Codex 模子次要针对 Unix 优化,
做为一款专为长时间运转和智能体(Agentic)编程使命设想的“前沿模子”,GPT-5.1-Codex-Max 引入了全新的“压缩(compaction)”手艺,OpenAI 现已将其设为 Codex 办事的默认模子。
对于泛博 Windows 开辟者而言,该模子可以或许持续施行使命跨越 24 小时而不掉线。GPT-5.1-Codex-Max 模子此前近通过 Codex CLI 和部门高级订阅渠道供给,展示了杰出的代码生成取修复能力。正在 SWE-Lancer IC SWE 中达到 79.9%,但鉴于其更高的运转速度和 token 效率,让其可以或许正在处置跨越 100 万 token 的超长上下文中连结高效运做。GPT-5.1-Codex-Max 特地针对 Windows 进行了锻炼。