AI行业日报:Grok Imagine 发布、Claude 攻破 Apple M5 防线、白领自动化倒计时
AI行业日报:Grok Imagine 发布、Claude 攻破 Apple M5 防线、白领自动化倒计时
5月18日 · 产品密集发布与安全攻防博弈交织,AI 正在重塑软件、职业与记忆的边界
01产品发布 / 更新
Grok Imagine 图像生成功能正式发布
X · Elon Musk (@elonmusk, xAI)Grok Imagine 现已正式发布,所有用户均可使用。基于 xAI 最新的文本到图像模型,能够生成逼真、高质量的图像,支持多种宽高比,目前可在 X 平台上直接使用。
查看原文 →手机端 ChatGPT 应用集成 Codex 构建功能
X · Greg Brockman (@gdb)用户现可在手机端通过 ChatGPT 应用中的 Codex 直接构建项目,将 AI 编程能力延伸至移动场景,大幅降低开发门槛。
查看原文 →02行业动态
人机快递分拣对决直播
X · 小互 (@xiaohu)Figure 直播上演机器人与人类在快递分拣任务上的正面对决,目前人类仅稍稍领先。这场直播直观展示了人形机器人在物流场景中的最新进展与差距。
查看原文 →03论文研究
Anthropic Claude 5 天攻破 Apple M5 macOS 内核漏洞
X · Berry Xia (@berryxia)Anthropic 的 Claude Mythos Preview 在 5 天内协助安全团队 Calif 成功构建并演示了首个公开的、针对 Apple M5 芯片 macOS 内核的内存破坏提权利用链。该攻击绕过了苹果耗时 5 年、投入数十亿美元打造的 MIE 硬件级内存完整性防护,从普通用户权限通过纯数据操作即可获得 root 权限。苹果已在后续更新中修复漏洞并致谢。此事件标志着 AI 驱动的安全研究能力已能极速突破顶尖硬件防护,显著改变了攻防的速度与平衡。
查看原文 →研究揭示 LLM 智能体记忆重写机制损害可靠性
X · Rohan Paul (@rohanpaul_ai)伊利诺伊大学与清华大学等机构的研究发现,LLM 智能体虽能从经验中学习,但其通过 LLM 将原始经历压缩成书面教训的记忆重写机制会损害记忆可靠性。在网页购物、模拟世界及 ARC 风格谜题等任务测试中,反复重写记忆会导致错误分组、规则过度泛化或过拟合。例如 GPT-4 在无记忆时可 100% 解决小型 ARC-AGI 问题集,而建立记忆并流式更新后性能降至约 54%。研究主张智能体记忆系统应重视原始经历作为关键证据,而非自动将所有经验重写为摘要。
查看原文 →04技巧与观点
开源工具揭露 AI API 中转站安全风险与检测差异
X · Berry Xia (@berryxia)开源项目 api-relay-audit 通过双论文锚定路线,对 AC-1 工具调用改写、AC-2 错误响应泄漏、上下文截断等常见攻击进行可验证的三态判定,并提供透明日志。对比 hvoy.ai 和 cctest.ai 等工具,其透明度和可审计性更为可靠。项目作者已将完整方法论、对比结果和功能速查表公开并开源。
查看原文 →Hermes 可配置的国内外 AI 模型及使用方法
X · Vista (@vista8)Hermes 支持配置多种国内外主流 AI 模型,包括 OpenAI GPT-5.5、xAI Grok-4.3、谷歌 Gemini 系列、DeepSeek V4 系列、智谱 GLM-5 系列、Kimi K2.6 以及小米 Mimo V2.5-pro。用户通过 /model 指令即可灵活切换对话模型,方便根据不同需求调用各模型的优势。
查看原文 →开源微信读书数据可视化工具 yao-weread-skill 发布
X · Vista (@vista8)开发者姚老师开源了微信读书 Skill——yao-weread-skill,能将用户的微信读书数据生成本地可视化报告。核心功能涵盖近两年阅读时长与节律分析、书架书籍构成、阅读分类与作者偏好,并对笔记和想法进行语义分析,最终通过词云、热力图、雷达图等 26 种图表形式呈现,所有代码已在 GitHub 公开。
查看原文 →Codex 视频生成方案:文本提示直接生成带动效的解释视频
X · 歸藏 (@op7418)该方案整合了藏师傅的 PPT Skill(视觉与动效)、HyperFrames(时间线与渲染)、Listenhub Skill(配音)以及即梦 CLI(补充片段)。用户可通过 Codex 直接基于文本提示生成带动效的解释视频,并能在聊天界面内预览,极大提升制作效率,特别适合产品介绍等视频内容。
查看原文 →Garry Tan 发布 GBrain:捅破个人 AI 天花板的知识系统
X · 阿易 AI Notes (@AYi_AInotes)GBrain 是一个知识系统而非简单的 RAG 工具,通过 8 层结构解决 AI Agent 的记忆缺陷:前 4 层升级基础检索,后 4 层实现终身记忆和自我进化,使 Agent 能持续追踪用户的人际关系、决策轨迹和认知演化。该系统已在生产环境中处理大量数据,以 Markdown 为最高优先级数据源,推动个人 AI 成为可能。
查看原文 →微软 AI CEO 预测 18 个月内 AI 自动化所有白领工作
X · Kim (@kimmonismus)微软 AI CEO Mustafa Suleyman 在 Fortune 采访中预测,AI 将在 18 个月内实现人类级性能,自动化大多数专业任务,包括会计、法律、营销和项目管理。他指出所有涉及"坐在电脑前"的白领工作都将被 AI 完全取代,并透露自己的使命是构建"超级智能",未来创建新 AI 模型将像制作播客或写博客一样便捷。
查看原文 →微信读书 Skill 安装与使用指南
X · Berry Xia (@berryxia)一份详尽的微信读书 Skill 安装和配置教程:官方指令可直接发给 Codex 或 Claude Code 下载安装;也可使用网友 @eviljer 制作的优化版 Skill;如需 API key 可访问微信官方页面获取。使用案例:直接对 AI 说"调用微信读书 skill 查看《被讨厌的勇气》的高亮划线"即可。
查看原文 →Anthropic CEO 预言软件免费化与职业结构巨变
X · Rohan Paul (@rohanpaul_ai)Anthropic CEO Dario Amodei 在《华尔街日报》YouTube 频道采访中表示,软件成本将急剧下降甚至基本免费,传统软件需百万用户分摊成本的前提将不再成立。同时,数十年来建立的许多工作和职业可能消失。Amodei 认为社会能够应对并适应这种变化,但他警告人们目前完全未意识到即将到来的变革及其巨大规模。
查看原文 →?今日观察
5 月 18 日的 AI 新闻呈现出三个清晰的主线:产品落地加速(Grok Imagine 全面开放、Codex 移动端集成)、安全攻防升级(Claude 攻破 M5 内核防线)、以及行业领袖的大胆预言(微软与 Anthropic CEO 分别预测白领自动化与软件免费化)。与此同时,学术界对 LLM 记忆机制的反思和开源社区对 API 安全透明度的推动,也为这场技术狂飙提供了必要的冷静锚点。未来 18 个月,或许真的会成为 AI 重塑社会结构的决定性窗口。