AI 日报 | 5月15日:从开源3D生成到macOS内核漏洞,智能体正在重塑技术边界
AI 日报 | 5月15日:从开源3D生成到macOS内核漏洞,智能体正在重塑技术边界
Granite多语言嵌入模型发布 · OpenCode再度免费开放 · Mythos AI五天发现两个macOS零日漏洞 · AI自主研究超越人类基准
今日要点:IBM发布Granite Embedding Multilingual R2多语言嵌入模型,32K上下文+Apache 2.0开源协议引发开发者关注;Anthropic的Mythos AI在五天内发现并利用两个未知macOS内核漏洞,标志着AI辅助安全研究进入新阶段;开源3D生成工具包将2D转3D流程从数天压缩至几分钟;Prime Intellect的AI智能体在nanoGPT优化赛道上超越人类基准——智能体的自主能力正在多个维度上取得实质性突破。
01 模型发布/更新
Granite Embedding Multilingual R2:开源多语言嵌入模型,具备32K上下文与领先检索性能
来源:Hugging Face BlogIBM Granite团队发布了Granite Embedding Multilingual R2多语言文本嵌入模型,采用Apache 2.0开源协议,上下文长度扩展至32K令牌,参数量低于1亿。在MTEB基准的检索评估中,该模型取得了同规模模型的最佳性能,尤其擅长多语言混合检索,为开发者提供了高效、轻量且可商用的嵌入解决方案。
查看原文 →02 产品发布/更新
开源3D生成工具包:单张图片快速构建可交互3D世界
来源:X · @berryxia开发者@neilsonks开源了一套专为Claude Code设计的完整3D生成工具包,能将输入的单张图片自动拆解,生成包含环境、网格、物理、灯光和音频的全套可交互3D场景。流程首先利用图像与3D生成技术提取物体并生成高质量网格,随后移除物体以得到静态背景,最后为整个场景添加物理模拟、实时灯光和环境音效。配套查看器支持点击编辑与一键导出,将以往需数天的2D转3D工作流程缩短至几分钟,适用于游戏开发、世界构建和产品可视化等项目。项目已在GitHub开源。
查看原文 →OpenCode与Qwen 3.6 Plus再度免费开放
来源:X · @opencodeOpenCode x Qwen 3.6 Plus再次免费开放。上次用户将容量当成了自助餐,团队找到了更多GPU,开启第二轮免费使用。
查看原文 →Claude 代理工具 v2.1.142 版本更新
来源:Claude Code GitHub ReleasesClaude代理工具发布v2.1.142版本,新增`--add-dir`、`--settings`、`--model`等8个用于配置后台会话的命令行标志,Fast模式默认模型升级为Opus 4.7。插件功能增强,拥有根目录`SKILL.md`的插件现可被识别为技能。此外修复了超过15项问题,包括MCP工具超时设置失效、后台会话异常断开、守护进程升级后无法正常退出、Windows网络驱动器死锁等关键错误。
查看原文 →Luma Agents高效生成电商素材全流程
来源:X · @LumaLabsAILuma Agents现已支持端到端电商活动素材生成。用户只需定义需求、设定风格,Agent即可处理所有电商活动素材,覆盖更多产品、更多市场、更多格式,消除创意瓶颈。
查看原文 →Codex推出自动化钩子与程序化令牌
来源:X · @OpenAIDevsCodex正变得更易于围绕用户代码实现自动化与定制。核心更新包括"钩子"功能,允许在任务关键节点运行脚本,进行工作验证、扫描密钥、记录对话或按仓库定制行为。同时面向商业和企业团队推出"程序化访问令牌",提供范围化凭证,支持从ChatGPT工作区设置创建,用于CI/CD、发布流程和内部自动化,支持设置过期或撤销,并将使用情况关联回工作区。
查看原文 →Mixpanel集成Replit MCP,开发流程内嵌数据分析
来源:X · @ReplitMixpanel现已登陆Replit MCP平台,实现产品发布与效果衡量的全流程一体化。下周伦敦黑客松将现场演示该集成能力。
查看原文 →SuperGrok Heavy限时六折,Grok Build开放测试
来源:X · @cb_dogeSuperGrok Heavy现提供约67%的半年折扣,每月仅需99美元(原价300美元)。建议升级至Heavy版本,并试用Grok Build的测试版。
查看原文 →Genkit 推出中间件系统:增强智能体AI应用的可控性与可靠性
来源:Google Developers BlogGoogle开源框架Genkit近日推出其核心中间件系统,旨在提升智能体AI应用的可靠性与可控性。该系统允许开发者在生成调用、模型及工具层进行拦截,注入自定义行为,如重试机制、模型回退以及人工介入的工具审批流程。通过创建并堆叠自定义中间件,开发者能够实现对模型输出的确定性控制。所有中间件的执行流程均可通过专用开发者界面实时查看与调试,有效支持使用TypeScript、Go、Dart和Python构建生产就绪的智能体应用。
查看原文 →Recraft AI V4.1上线OpenRouter平台
来源:X · @OpenRouterRecraft AI V4.1已在OpenRouter上线,包含六款新图像生成模型:追求高美学的V4.1和V4.1 Pro,用于SVG插画的V4.1 Vector和V4.1 Pro Vector,以及优先考虑克制风格产品图像的V4.1 Utility和V4.1 Utility Pro。照片级真实感更自然,渐变更平滑,简短提示词能更准确地命中目标,无需过多手动调整。
查看原文 →03 行业动态
Runway正式进军日本市场,在东京设立总部并投入4000万美元
来源:Runway News生成式AI公司Runway宣布在日本东京设立总部,正式进军日本市场,并计划投入4000万美元初始资金拓展业务。日本已成为Runway增长最快的市场之一,是其全球企业及自助客户的第三大市场。过去一年,日本企业客户数量增长300%,贡献了Runway亚洲总销售额的三分之一。软银、雅马哈等企业已在营销与创意流程中使用其服务。公司此次扩张旨在贴近日本领先的创意、机器人及制造行业客户,并已开始招募日本市场负责人以组建本地团队。
查看原文 →Anthropic的Mythos AI在五天内协助发现并利用两个未知macOS内核漏洞
来源:X · @rohanpaul_ai / 华尔街日报据《华尔街日报》报道,Anthropic的Mythos AI工具在短短五天内,成功帮助研究人员发现了两个此前未知的macOS内核漏洞,并将其串联成一个完整的权限提升攻击链。该攻击针对操作系统最底层核心,通过组合多个漏洞和技术,绕过了苹果的内存完整性保护机制,访问了本应受保护的系统区域。这凸显出现代macOS的防御重点已从单纯防止漏洞发现,转向增加漏洞利用难度。Mythos在此类研究中展现出强大能力,因为它能协助形成假设、分析代码行为、推理底层约束并建议利用路径,从而大幅加速传统上依赖手动、试错的研究过程。
查看原文 →OpenEvidence覆盖65%美国医生,shadow AI模式引关注
来源:X · @frxiaobeiOpenEvidence已覆盖65%的美国医生,4月单月临床场景使用达2700万次,平均每位医生每月使用41次。平台由医生个人通过执业编号在手机上注册,医院最初不知情,Mount Sinai的AI负责人称此为shadow AI,表示其早在基层普及。医院后来才追签企业合作,OpenEvidence强调这是美国医疗史上首次让大多数医生自愿采用单一技术平台的突破。合作伙伴包括NEJM、JAMA、NCCN和Wiley。
查看原文 →04 论文研究
AI自主研究实现突破:智能体在nanoGPT优化赛道上超越人类基准
来源:X · @berryxia / Prime IntellectPrime Intellect近期在AI研究自动化领域取得重要进展。他们让Claude Code与Codex智能体完全自主运行于nanoGPT速度挑战的优化器赛道,利用闲置算力完成了近万次实验,消耗约1.4万H200小时。最终,Claude Code将记录提升至2930步,超越了2990步的人类基准。实验显示,智能体在系统整合社区主流优化方法、进行超参数扫描和策略组合方面效率极高,但在要求真正创新的"新颖性检查"环节未能突破基线。该项目将所有实验记录、日志和代码开源,使得AI自主研究从概念转化为可复现的现实。
查看原文 →05 技巧与观点
在 Windows 上构建安全有效的沙箱以启用 Codex
来源:OpenAI 官网OpenAI为Windows平台上的Codex构建了一个安全沙箱环境。该沙箱通过严格控制文件访问权限和实施网络限制,确保了代码生成与执行过程的安全性。这一举措使得基于Codex的编码助手能够以高效且受控的方式运行,在提供强大编程辅助功能的同时,有效隔离了潜在风险,保障了用户系统的安全。
查看原文 →Yetone发布Native Feel桌面应用开发Agent Skill
来源:X · @berryxia开发者Yetone将一篇关于桌面应用开发"最佳实践"的文章转化为一个名为"native-feel-skill"的Agent Skill。该Skill旨在帮助开发者利用Coding Agent,轻松地重构或开发跨平台桌面应用,并使其获得极其接近Native原生应用的性能体验。项目代码已开源在GitHub上。
查看原文 →API提示预缓存加速首令牌生成
来源:X · @ClaudeDevs减少API长提示首令牌生成时间的实用技巧:预热提示缓存。在用户提示前发送系统提示,Claude会将其写入缓存但跳过生成任何输出。当真实用户请求到达时,将直接命中预热缓存,显著加速首令牌生成。
查看原文 →2028年全球AI领导地位的两种情景
来源:Anthropic Research报告展望2028年中美AI竞争的两种前景。若美国及盟友维持并扩大在关键计算芯片上的优势,通过加强出口管制、遏制技术窃取并加速AI应用,民主国家可确立12-24个月的技术领先,主导AI规则制定。反之,若政策松动,中国可能借助人才优势、利用管制漏洞迅速逼近甚至反超,使威权政权获得大规模自动化压制能力。当前民主国家在计算领域优势显著,但窗口期有限,需立即行动锁定胜局。
查看原文 →在大型代码库中高效运用Claude Code:最佳实践与入门指南
来源:Claude BlogClaude Code已成功部署于数百万行的单体仓库、遗留系统及分布式架构中。其核心在于围绕模型构建的"工具套件",包含五个关键扩展点:提供代码库概览的CLAUDE.md文件、实现持续改进的钩子、按需加载专业知识的技能、插件以及MCP服务器。它采用智能体搜索模式,直接在开发者本地实时代码库上操作,无需构建和维护集中式索引,从而避免了传统RAG系统在活跃大型代码库中索引过时的问题。
查看原文 →创始人手册:构建AI原生初创公司
来源:Claude BlogAnthropic公司发布了一份面向AI原生初创企业的实用指南,旨在重塑2026年创业生命周期的构思、最小可行产品、发布和规模化四个核心阶段。该手册为每个阶段提供了具体目标、退出标准、常见失败模式及AI驱动练习,涵盖如何利用Claude进行问题验证与客户发现、避免AI生成代码的技术债务、区分真实产品市场契合度与早期炒作,并引入智能工作流替代创始人手动操作。指南还整合了多家初创企业的实践案例,为从零开始围绕AI构建公司的创始人提供架构、范围与安全方面的最佳实践。
查看原文 →? 结语
今天的AI资讯呈现出几个清晰的主题:智能体能力边界正在快速拓展——从Mythos AI在安全领域的突破到AI自主研究超越人类基准,智能体正在从辅助工具演变为具备独立探索能力的系统;开源生态持续繁荣——Granite嵌入模型、3D生成工具包、Agent Skill等项目以开源方式加速技术扩散;企业级应用走向纵深——Genkit中间件、Codex沙箱、Claude Code大型代码库实践等显示出AI工具在生产环境中的成熟度正在提升。值得持续关注的是,AI在安全领域的能力跃迁可能引发新一轮攻防平衡的重构。