今日概览
今天的候选集中在 AI Agent 工程落地与底层基础设施优化两条主线上。Hermes Agent 在数仓工作流中的规则资产化实践、淘宝面向 Skills 编程的提效成果,展示了 Agent 赋能企业级研发的成熟度在提升;而字节的 AI-Infra 固件安全和腾讯的大模型核心操作拆解,则从底层基础设施和算法优化角度提供了扎实的技术输入。
今日重点
1. 从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
文章介绍 Hermes Agent 如何通过单 Agent 编排多能力模块,将埋点需求处理中的规则、上下文和工具接口资产化,实现流程可控、可回放。该方法将数据承接方从信息拼凑中解放,聚焦业务语义和风险判断,形成端到端数仓工作流。
值得关注:
- Hermes Agent 采用单 Agent 编排多能力模块,而非多 Agent 独立运行,降低系统复杂度。
- 能力模块是固化流程契约,包含输入、动作边界、输出产物和失败处理,确保执行可预期。
- 规则资产化将历史口径和判断经验沉淀为可复用检查清单,大幅减少重复劳动。
这篇内容更值得关注的原因在于,它展示了 Agent 从原型验证走向生产级工程化的真实路径——不是追逐新概念,而是解决具体的流程标准化和知识复用问题,对任何在做 Agent 落地的团队都有参考价值。
2. 初探 AI-Infra 下的服务器固件安全实践
文章分析 AI-Infra 环境下服务器固件(BMC、BIOS、GPU 等)面临的安全挑战,提出整机可信视角的安全架构,涵盖数字签名、安全启动、可信度量等实践。通过大规模漏洞修复案例验证在线升级等治理路径的有效性。
值得关注:
- AI-Infra 使服务器固件面临业务价值高、部件复杂度高、资源复用风险强等三重挑战。
- 火山引擎采用签名体系(PKI/HSM)、安全启动(PROT+IROT)和可信度量(SPDM+TPM)构建安全底座。
- 强调从事件驱动的被动响应转向默认安全能力的主动防御策略。
这篇内容更值得关注的原因在于,AI 集群规模扩大后,固件安全不再是边缘话题——它是决定集群可靠性和安全基线的关键层,字节的经验对自建或运维 AI 基础设施的团队有直接参考意义。
3. 拆解大模型几项核心操作背后的数学与 Infra 优化逻辑
文章拆解大模型中 RMSNorm、Softmax 等核心操作的数学原理与 Infra 优化策略,阐述如何通过数学等价变换和精度取舍提升硬件利用率与推理速度,并介绍 Online Softmax、FlashAttention 等关键技术。
值得关注:
- RMSNorm 去掉均值计算,减少访存和计算量,已成为现代 LLM 的标准归一化方案。
- Softmax 通过减去最大值技巧和除以√d 缩放,同时解决数值溢出和梯度消失问题。
- Causal Mask 在 FlashAttention 中通过块稀疏调度实现零 HBM 额外开销,显著提升长序列推理效率。
这篇内容更值得关注的原因在于,它将大模型底层的数学原理与工程优化打通了——理解了这些操作为什么这样设计,才能在看 Infra 优化时知道每步优化解决了什么问题。
4. 面向 Skills 编程-淘宝企业购端对端研发提效实践
文章提出"面向 Skills 编程"范式,将领域知识、工作流和约束规则封装为可版本化的 Skills 单元,实现从人写代码到人沉淀 Skills、AI 写代码的升级。在企业购客户对接场景中,交付周期缩短 65%,代码一次生成成功率达 90%。
值得关注:
- 通过 SOP 构建和分层架构设计,商品域端到端交付周期从 23.5 人日缩短至 8 人日。
- 代码生成成功率从不足 50% 提升至 90%,关键在于接口提取、领域知识注入和架构拆分等知识工程手段。
- Skills 单元可独立版本化管理,支持持续积累和复用,形成组织级 AI 编码资产。
这篇内容更值得关注的原因在于,它是 AI 辅助编码方法论的一次重要升级——从"写 prompt 让 AI 生成代码"升级为"先沉淀领域知识,再让 AI 在确定性框架内生成",提效数据扎实,思路可复制。
趋势观察
- Agent 落地正在从概念验证转向工程化复制。得物数仓和淘宝企业购的案例都指向同一个方向:不是追逐更强大的模型,而是把现有能力通过规则化、Skills 化的方式稳定复用。
- AI 基础设施的安全和效率问题开始被认真对待。字节的固件安全和腾讯的 Infra 优化拆解表明,随着集群规模和模型参数的增长,底层的安全基线和计算效率已经成了不可回避的工程课题。
- Skills/能力模块化成为 AI 工程化的核心组织方式。无论是 Hermes Agent 的能力模块、淘宝的 Skills 单元还是规则资产化,都在强调解耦、复用和可组合,而不是继续把智能体当成不可拆分的黑箱。
延伸阅读
- 从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流|得物技术
- 初探 AI-Infra 下的服务器固件安全实践|字节跳动技术团队
- 拆解大模型几项核心操作背后的数学与 Infra 优化逻辑|腾讯技术工程
- 面向 Skills 编程-淘宝企业购端对端研发提效实践|大淘宝技术