法国AI初创公司Mistral AI发布了Devstral 2,这是一个拥有1230亿参数的开放权重编程模型,在SWE-bench Verified基准测试中获得72.2%的分数。该公司还推出了名为Mistral ...
作为AAIF的首批三个项目之一,由Anthropic开发的MCP协议无疑是当前生态中最具影响力的技术标准。截至基金会成立时,已有超过10,000个MCP服务器发布,被包括Claude、Cursor、微软Copilot、Gemini、VS ...
1106 天,OpenAI 从掀桌子的人,变成了被掀桌子的人。 伴随着 Google Gemini 3 的发布,OpenAI CEO 奥特曼上周罕见拉响了「Code Red」红色警报,并宣布所有资源回流 ChatGPT 主线,其他业务一律靠边站。
更夸张的是在 SWE-bench Verified 里直接干到 80%,成为目前最高记录。这意味着 GPT-5.2 Thinking 能更可靠地调试生产环境中的代码、实现功能需求、重构大型代码库,端到端的修复工作做得更高效,减少人工介入。
OpenAI给出的官方文档明确指出,GPT-5.2 的设计初衷在于“创造更大的经济价值”。相较前代,它在电子表格处理、演示文稿制作、代码编写、图像感知、长文本理解及复杂多步项目执行等方面,均实现了全面性能跃升。
OpenAI 刚刚发布了最新的 GPT-5.2,不要被他的版本号欺骗,这是今年 OpenAI ...
整理|华卫刚刚,GPT-5.2来了。一共三个版本:GPT-5.2 Instant 是一款高效实用的日常工作与学习工具,在信息检索问答、操作指引、技术文档撰写及翻译等方面均有显著优化,同时延续了GPT-5.1 ...
凌晨突发!GPT-5.2上线,首批实测后感叹:确实是第一,但不再是唯一的王,openai,工作流,编程,智能体,gpt ...