DeepSeek 永久降价、谷歌 I/O 发布 AI 代理全栈工具链
DeepSeek 永久降价、谷歌 I/O 发布 AI 代理全栈工具链
AI行业5月23日速览:Claude自动模式升级Pro计划、英伟达预测AI基建年开支达4万亿、GitHub连续三年称霸企业AI编程代理
今日AI圈迎来密集产品更新与行业里程碑事件。DeepSeek宣布V4-Pro永久降价,谷歌在I/O大会上亮出AI代理全栈开发工具链,英伟达黄仁勋更是豪言AI基建年度开支将冲向4万亿美元。与此同时,Claude、OpenAI、GitHub等巨头纷纷发布新功能,AI应用生态正以前所未有的速度扩张。
01 产品发布/更新
Claude Code v2.1.149 更新摘要
Claude Code: GitHub Releases本次更新包含功能增强、企业设置和多项修复。新增 /usage 命令的使用量分类显示功能,可区分技能、子代理、插件及每个MCP服务器的消耗;/diff 详情视图支持键盘滚动;Markdown输出兼容GFM任务列表。企业版新增 allowAllClaudeAiMcps 设置以加载云MCP连接器。修复了PowerShell权限绕过、Git工作树沙盒写入白名单越界等安全问题。
查看原文 →Claude自动模式新增Pro计划与模型支持
Claude Devs自动模式的两项更新:现已在Pro计划中提供,现已支持Sonnet 4.6以及Opus 4.7。按下Shift+tab,让Claude运行。
查看原文 →OpenAI新增差异标记样式设置选项
OpenAI Developers已发布剪纸功能:外观设置中新增差异标记样式。在查看差异时更喜欢经典的 + / - 标记?现在你可以选择使用它们,而不仅仅是彩色差异条。默认设置保持不变,除非你主动选择启用。
查看原文 →Warp现已支持OpenRouter接入
OpenRouterOpenRouter现已在Warp中得到支持。工程师Dagm Assefa展示了如何连接DeepSeek和OpenRouter。
查看原文 →谷歌I/O大会发布AI代理全套开发工具链
Google AI谷歌在I/O开发者大会宣布系统性构建面向AI代理的开发与部署工具链。核心更新包括:独立桌面应用Antigravity 2.0及其命令行工具、SDK面世;Google AI Studio新增Kotlin支持,可一键开发安卓应用并发布;Gemini API推出托管代理服务;WebMCP作为开放标准在Chrome 149中推出;Chrome DevTools也开放给AI代理以自动化调试。此举标志着谷歌正全面打造从开发、接口到部署的完整AI代理生态系统。
查看原文 →02 行业动态
扩大与新加坡合作,推动AI安全规模化部署
Google DeepMind我们正在扩大与新加坡的合作,以帮助安全地大规模部署AI。与各国专家合作,新项目将重点加速科学发现、加强大流行病防范并改善医疗保健。
查看原文 →AI替代入门级工作:科技行业受裁员冲击最重,74% CEO冻结或缩减招聘
IT之家奥纬咨询研究发现,AI工具正被广泛用于入门级任务,导致企业招聘重心转向高级岗位,年轻人求职难度加大。计划削减初级岗位的比例从17%跃升至43%,而招聘转向中层岗位的比例则升至30%。尽管超90%的企业在部署AI,但多数仍处试点阶段。过快裁员或忽视初级人才储备,可能对人才梯队造成长远风险。
查看原文 →黄仁勋:AI基建年度开支要冲到4万亿美元
IT之家英伟达发布2027财年Q1财报,营收816亿美元,同比增长85%,净利润583亿美元,翻两倍多,市值达5.7万亿美元,已超德国2026年GDP预测。黄仁勋预测,超大规模云厂商的AI基建年度开支将从当前的1万亿美元,增长至3-4万亿美元。财报同时显示,数据中心业务营收752亿美元,占比超九成。
查看原文 →Project Glasswing:利用AI保障关键软件安全
Anthropic: Newsroom通过约50家合作伙伴使用Claude Mythos Preview模型,已在全球关键系统中发现超过10,000个高危或严重漏洞。多家合作伙伴报告漏洞发现效率提升超过十倍。例如,Cloudflare在关键路径系统发现2,000个漏洞;Mozilla在Firefox 150中发现并修复271个漏洞。项目还扫描了千余个支撑互联网的开源项目,独立验证准确率达90.6%。这标志着AI网络安全能力进入新阶段。
查看原文 →回顾Google I/O 2026对话环节
Google Blog: AI在2026年Google I/O开发者大会上,行业领导者围绕人工智能、量子计算、机器人学以及创造力等核心议题展开了深入探讨,旨在勾勒这些前沿领域的技术演进路径与发展蓝图。
查看原文 →GitHub连续第三年被Gartner评为企业级AI编程代理领域领导者
GitHub BlogGartner最新发布的魔力象限报告中,GitHub连续第三年被列为"领导者"象限。GitHub表示,其致力于构建一个开放、安全且由AI驱动的平台,以赋能每一位开发者并定义软件开发的未来。
查看原文 →03 论文研究
Nemotron-Labs 扩散语言模型实现光速级文本生成
Hugging Face: BlogNVIDIA在Hugging Face发布了关于Nemotron-Labs扩散语言模型的技术博客。该研究聚焦于通过扩散语言模型架构大幅提升文本生成速度,目标是逼近"光速级"生成效率。相较于传统自回归模型在延迟和吞吐量方面具有性能优势。
查看原文 →AlphaProof Nexus:用形式化验证驱动AI数学证明搜索
Rohan PaulGoogle DeepMind提出AlphaProof Nexus系统,将大型语言模型与Lean形式化验证工具相结合。系统允许LLM在生成证明的过程中不断读取Lean的编译错误并进行修正,迫使模型将每一步逻辑都转化为可编译、可验证的代码。在针对353个Erdős问题和492个开放猜想的测试中,系统成功解决了9个Erdős问题并证明了44个序列猜想。该研究展示了形式化验证在暴露AI逻辑错误中的关键作用。
查看原文 →04 技巧与观点
Kakuna:自动化加固代码库的AI代理工具
swyxKakuna是一款AI代理工具,旨在将早期快速原型自动转化为可维护的生产级代码库。它通过内置检查清单和"计划-目标"工作流,自动执行代码审查、测试补充、重构等工作,并强调子代理并行以提升效率。其核心是"反熵增"与"反代码腐化"。一次约16小时的运行能生成上百次提交,将脆弱的MVP转变为结构清晰、可长期构建的稳定项目。
查看原文 →Perplexity开源供应链安全扫描工具Bumblebee
PerplexityPerplexity开源了Bumblebee,一个适用于macOS和Linux的只读扫描器。它检查开发者机器上的高风险软件包、扩展和AI工具配置。连接到Computer后,每当出现新的供应链风险时,它可以触发更深入的扫描。
查看原文 →智能体工作负载悄然重塑推理经济
SemiAnalysis智能体工作负载正在悄然重塑推理经济学。SemiAnalysis从43.2万个真实编码智能体请求中提取数据,发现中位数是9.6万输入token。这意味着在你输入问题之前,模型已处理了超过《了不起的盖茨比》全文长度的文本。
查看原文 →📌 结语
今日的AI行业呈现出鲜明的两极化趋势:一方面谷歌、英伟达、Anthropic等巨头在算力基建与开发工具链上疯狂押注,另一方面企业端对初级岗位的替代焦虑也在加剧。AI代理从单一对话正向全栈开发、形式化验证、供应链安全等垂直领域深度渗透,产业正在经历从"能用"到"好用"的关键转折。