AI行业日报：Grok Imagine 发布、Claude 攻破 Apple M5 防线、白领自动化倒计时

2026-05-18 作者：Covsun & Bob 浏览量：75

AI日报

AI行业日报：Grok Imagine 发布、Claude 攻破 Apple M5 防线、白领自动化倒计时

5月18日 · 产品密集发布与安全攻防博弈交织，AI 正在重塑软件、职业与记忆的边界

? 2025年5月18日 · 周一 ? AIHOT 数据聚合 ? 共 13 条精选资讯

    今日速览：Elon Musk 宣布 Grok Imagine 图像生成功能正式向所有用户开放；Anthropic Claude 在 5 天内攻破 Apple M5 macOS 内核，终结了苹果耗时五年、耗资数十亿美元打造的硬件级防线；微软 AI CEO 预测 18 个月内 AI 将自动化所有白领工作——产品落地、安全博弈与职业变革三重浪潮正同步加速。
  

01产品发布 / 更新

Grok Imagine 图像生成功能正式发布

X · Elon Musk (@elonmusk, xAI)

Grok Imagine 现已正式发布，所有用户均可使用。基于 xAI 最新的文本到图像模型，能够生成逼真、高质量的图像，支持多种宽高比，目前可在 X 平台上直接使用。

查看原文 →

手机端 ChatGPT 应用集成 Codex 构建功能

X · Greg Brockman (@gdb)

用户现可在手机端通过 ChatGPT 应用中的 Codex 直接构建项目，将 AI 编程能力延伸至移动场景，大幅降低开发门槛。

查看原文 →

02行业动态

人机快递分拣对决直播

X · 小互 (@xiaohu)

Figure 直播上演机器人与人类在快递分拣任务上的正面对决，目前人类仅稍稍领先。这场直播直观展示了人形机器人在物流场景中的最新进展与差距。

查看原文 →

03论文研究

Anthropic Claude 5 天攻破 Apple M5 macOS 内核漏洞

X · Berry Xia (@berryxia)

Anthropic 的 Claude Mythos Preview 在 5 天内协助安全团队 Calif 成功构建并演示了首个公开的、针对 Apple M5 芯片 macOS 内核的内存破坏提权利用链。该攻击绕过了苹果耗时 5 年、投入数十亿美元打造的 MIE 硬件级内存完整性防护，从普通用户权限通过纯数据操作即可获得 root 权限。苹果已在后续更新中修复漏洞并致谢。此事件标志着 AI 驱动的安全研究能力已能极速突破顶尖硬件防护，显著改变了攻防的速度与平衡。

查看原文 →

研究揭示 LLM 智能体记忆重写机制损害可靠性

X · Rohan Paul (@rohanpaul_ai)

伊利诺伊大学与清华大学等机构的研究发现，LLM 智能体虽能从经验中学习，但其通过 LLM 将原始经历压缩成书面教训的记忆重写机制会损害记忆可靠性。在网页购物、模拟世界及 ARC 风格谜题等任务测试中，反复重写记忆会导致错误分组、规则过度泛化或过拟合。例如 GPT-4 在无记忆时可 100% 解决小型 ARC-AGI 问题集，而建立记忆并流式更新后性能降至约 54%。研究主张智能体记忆系统应重视原始经历作为关键证据，而非自动将所有经验重写为摘要。

查看原文 →

04技巧与观点

开源工具揭露 AI API 中转站安全风险与检测差异

X · Berry Xia (@berryxia)

开源项目 api-relay-audit 通过双论文锚定路线，对 AC-1 工具调用改写、AC-2 错误响应泄漏、上下文截断等常见攻击进行可验证的三态判定，并提供透明日志。对比 hvoy.ai 和 cctest.ai 等工具，其透明度和可审计性更为可靠。项目作者已将完整方法论、对比结果和功能速查表公开并开源。

查看原文 →

Hermes 可配置的国内外 AI 模型及使用方法

X · Vista (@vista8)

Hermes 支持配置多种国内外主流 AI 模型，包括 OpenAI GPT-5.5、xAI Grok-4.3、谷歌 Gemini 系列、DeepSeek V4 系列、智谱 GLM-5 系列、Kimi K2.6 以及小米 Mimo V2.5-pro。用户通过 /model 指令即可灵活切换对话模型，方便根据不同需求调用各模型的优势。

查看原文 →

开源微信读书数据可视化工具 yao-weread-skill 发布

X · Vista (@vista8)

开发者姚老师开源了微信读书 Skill——yao-weread-skill，能将用户的微信读书数据生成本地可视化报告。核心功能涵盖近两年阅读时长与节律分析、书架书籍构成、阅读分类与作者偏好，并对笔记和想法进行语义分析，最终通过词云、热力图、雷达图等 26 种图表形式呈现，所有代码已在 GitHub 公开。

查看原文 →

Codex 视频生成方案：文本提示直接生成带动效的解释视频

X · 歸藏 (@op7418)

该方案整合了藏师傅的 PPT Skill（视觉与动效）、HyperFrames（时间线与渲染）、Listenhub Skill（配音）以及即梦 CLI（补充片段）。用户可通过 Codex 直接基于文本提示生成带动效的解释视频，并能在聊天界面内预览，极大提升制作效率，特别适合产品介绍等视频内容。

查看原文 →

Garry Tan 发布 GBrain：捅破个人 AI 天花板的知识系统

X · 阿易 AI Notes (@AYi_AInotes)

GBrain 是一个知识系统而非简单的 RAG 工具，通过 8 层结构解决 AI Agent 的记忆缺陷：前 4 层升级基础检索，后 4 层实现终身记忆和自我进化，使 Agent 能持续追踪用户的人际关系、决策轨迹和认知演化。该系统已在生产环境中处理大量数据，以 Markdown 为最高优先级数据源，推动个人 AI 成为可能。

查看原文 →

微软 AI CEO 预测 18 个月内 AI 自动化所有白领工作

X · Kim (@kimmonismus)

微软 AI CEO Mustafa Suleyman 在 Fortune 采访中预测，AI 将在 18 个月内实现人类级性能，自动化大多数专业任务，包括会计、法律、营销和项目管理。他指出所有涉及"坐在电脑前"的白领工作都将被 AI 完全取代，并透露自己的使命是构建"超级智能"，未来创建新 AI 模型将像制作播客或写博客一样便捷。

查看原文 →

微信读书 Skill 安装与使用指南

X · Berry Xia (@berryxia)

一份详尽的微信读书 Skill 安装和配置教程：官方指令可直接发给 Codex 或 Claude Code 下载安装；也可使用网友 @eviljer 制作的优化版 Skill；如需 API key 可访问微信官方页面获取。使用案例：直接对 AI 说"调用微信读书 skill 查看《被讨厌的勇气》的高亮划线"即可。

查看原文 →

Anthropic CEO 预言软件免费化与职业结构巨变

X · Rohan Paul (@rohanpaul_ai)

Anthropic CEO Dario Amodei 在《华尔街日报》YouTube 频道采访中表示，软件成本将急剧下降甚至基本免费，传统软件需百万用户分摊成本的前提将不再成立。同时，数十年来建立的许多工作和职业可能消失。Amodei 认为社会能够应对并适应这种变化，但他警告人们目前完全未意识到即将到来的变革及其巨大规模。

查看原文 →

?今日观察

5 月 18 日的 AI 新闻呈现出三个清晰的主线：产品落地加速（Grok Imagine 全面开放、Codex 移动端集成）、安全攻防升级（Claude 攻破 M5 内核防线）、以及行业领袖的大胆预言（微软与 Anthropic CEO 分别预测白领自动化与软件免费化）。与此同时，学术界对 LLM 记忆机制的反思和开源社区对 API 安全透明度的推动，也为这场技术狂飙提供了必要的冷静锚点。未来 18 个月，或许真的会成为 AI 重塑社会结构的决定性窗口。

文章资讯

AI行业日报：Grok Imagine 发布、Claude 攻破 Apple M5 防线、白领自动化倒计时

01产品发布 / 更新

Grok Imagine 图像生成功能正式发布

手机端 ChatGPT 应用集成 Codex 构建功能

02行业动态

人机快递分拣对决直播

03论文研究

Anthropic Claude 5 天攻破 Apple M5 macOS 内核漏洞

研究揭示 LLM 智能体记忆重写机制损害可靠性

04技巧与观点

开源工具揭露 AI API 中转站安全风险与检测差异

Hermes 可配置的国内外 AI 模型及使用方法

开源微信读书数据可视化工具 yao-weread-skill 发布

Codex 视频生成方案：文本提示直接生成带动效的解释视频

Garry Tan 发布 GBrain：捅破个人 AI 天花板的知识系统

微软 AI CEO 预测 18 个月内 AI 自动化所有白领工作

微信读书 Skill 安装与使用指南

Anthropic CEO 预言软件免费化与职业结构巨变

?今日观察