今日概览

今天的候选集中在 AI Agent 工程落地、模型训练基础设施与数据架构演进三条主线上。Claude Code 的 CLAUDE.md—Skills—Subagents 分层上下文体系、爱奇艺的 Agentic Quality Engineering 框架,展示了 Agent 从"能用"到"工程化可维护"的推进路径;智谱开源 Slime RL 训练框架、阿里云零 ETL 实时入湖方案,则在训练效率和数据基础设施层面提供了扎实的技术输入。

今日重点

1. 深入理解 Claude Code:从 CLAUDE.md 到 Hooks、Skills、Subagents

文章系统介绍了 Claude Code 的多种上下文注入方法及其适用场景。CLAUDE.md 全程加载存放固定事实,Skills 按需加载处理步骤性指令,Hooks 绑定生命周期事件,Subagents 在独立上下文中完成复杂任务——合理组合这些机制才能构建稳定高效的 Agent 应用。

值得关注:

  • CLAUDE.md 全程加载,适合存放构建命令、目录结构等固定事实,是上下文的基础层。
  • Skills 按需加载,只在被调用时进入上下文,适合存放部署流程等步骤性指令。
  • Subagents 在独立上下文中运行,完成复杂任务后返回摘要,不污染主会话。

这篇内容更值得关注的原因在于,它把 Agent 上下文管理从"一股脑塞 prompt"变成了分层架构——CLAUDE.md 做底座、Skills 做插件、Subagents 做隔离,这套思路和你日常用的 Hermes Agent 技能体系高度相通。

2. 太狠了,智谱把 GLM-5.2 的炼丹炉直接开源了

智谱开源了强化学习后训练框架 Slime。基于 Megatron 训练和 SGLang 推理的无缝连接,GLM-5.2 的后训练仅用约 2 天完成,评测水平接近 Opus 4.8。Slime 支持 Qwen、DeepSeek、Llama 等主流模型,经过多个顶尖模型验证。

值得关注:

  • Slime 是深度优化的强化学习后训练框架,将 Megatron 训练与 SGLang 推理无缝连接,大幅降低工程复杂度。
  • GLM-5.2 使用 Slime,仅 2 天完成 OPD 后训练,效率惊人。
  • Slime 支持 Qwen、DeepSeek、Llama 等主流模型的强化学习后训练,通用性强。

这篇内容更值得关注的原因在于,Slime 不只是 GLM-5.2 的训练工具——它是一个通用化的 RL 训练框架开源出来,意味着任何团队都可以复现类似的训练管线,这才是真正的行业推动力。

3. AI 时代,实时入湖正在告别 ETL:从 Kafka 到 Iceberg 的架构减法

文章探讨实时入湖从传统 ETL 向零 ETL 架构演进的趋势。作者提出 Kafka×Table Bucket 方案,将通用入湖能力内聚为平台能力,通过将消息到表的转换前移到 Broker 链路,显著降低复杂度和运维成本。

值得关注:

  • 实时入湖正从依赖 Flink/Spark 的外部 ETL 转向零 ETL 内建能力,这是架构层面的大方向变化。
  • Kafka×Table Bucket 方案将消息到表的转换前移到 Broker 链路,减少中间处理环节。
  • 方案支持 Schema 自适应演进、多层小文件治理和完整 CDC/Upsert,工程化程度高。

这篇内容更值得关注的原因在于,零 ETL 不是一个口号——Kafka×Table Bucket 给出了可落地的技术方案,对任何有实时数据管线的团队都有实际参考价值。

4. AI 时代的质量门禁左移:Agentic Quality Engineering 架构与落地模板

文章提出将质量门禁左移至开发活动内部,通过 AI Harness、Planner Agent、Subagents 和证据总线实现证据驱动的验证闭环。核心架构引入风险分级策略,将测试从人力后置活动升级为系统化能力。

值得关注:

  • 质量门禁左移的本质是把验证能力前置到开发活动中,让 AI 生成的变更尽早进入可执行验证闭环。
  • AI 在质量门禁中扮演 Quality Orchestrator 角色,通过 Harness 管理上下文,Agent 拆解任务,Subagent 专项验证。
  • 面向 AI 的测试用例需写成可执行契约,明确输入、环境、步骤、断言和证据要求。

这篇内容更值得关注的原因在于,它把"AI 生成代码后的质量怎么保证"这个实际难题,从人肉审核升级成了 Agent 驱动的系统化验证——Harness + Agent + Subagent + 可执行契约的组合,可能是 AI 工程化的下一个关键基础设施。

5. DeepSeek 融资故事

文章披露了 DeepSeek 于 2025 年 5 月举办的线上投资人会议细节。创始人梁文锋强调追求 AGI、团队稳定和克制。融资条件独特——要求大额纯人民币出资,最终约 10 家机构参与,红杉和高瓴未入场。

值得关注:

  • 梁文锋在会议上强调追求 AGI、团队稳定最重要,融资只是实现目标的手段。
  • 融资初始要求额度不小于 50 亿、不能分拆份额、纯人民币结构,门槛极高。
  • 最小出资额后下调至 15 亿,显示出机构对 DeepSeek 的认可度仍然很高。

这篇内容更值得关注的原因在于,DeepSeek 的融资方式很特别——高门槛、大额、纯人民币、拒绝美元基金,反映了创始人极强的控制欲和对团队独立的坚持,是 AI 行业融资生态中的独特样本。

趋势观察

  1. Agent 工程化正在从"怎么让 AI 干活"升级为"怎么让 AI 干活且可维护"。Claude Code 的分层上下文、爱奇艺的 Agentic Quality Engineering 都在回答同一个问题:AI 替人工作后,质量和可追溯性怎么保证。
  2. 模型训练基础设施开源化加速。Slime 框架开源意味着 RL 后训练不再是少数巨头的专属能力,中小团队也能借助现成工具复现顶尖模型的后训练管线。
  3. 数据基础设施正在做"减法"。零 ETL 架构体现出行业从堆组件到做整合的方向转变——不是引入更多工具,而是把能力内建到现有链路中。

延伸阅读