今日概览

今天的选文覆盖了从底层基础设施到上层 Agent 工程范式的完整链条。爱奇艺的 QBFS 混合云存储解决的是「数据怎么存怎么管」的问题,腾讯混元的 HPC-Ops 算子库解决的是「推理怎么跑得快」的问题,Loop 工程则回答了「Agent 怎么写才能持续迭代」的问题。三个问题恰好构成了 AI 落地的基础设施栈——存得好、算得快、编得对。

今日重点

1. 爱奇艺大数据混合云存储

爱奇艺自研 QBFS 大数据文件系统构建混合云存储架构,提供统一命名空间,屏蔽底层 HDFS 和多种公有云对象存储的差异,实现云上云下数据的无感路由、透明迁移与智能缓存。核心设计包括混合云分层存储(标准、低频、归档三层)和基于 Alluxio 的混合云缓存层,支持表级和时间分区的透明迁移——业务无需修改应用程序即可完成数据搬迁。该架构已在爱奇艺全面落地,降低存储计算成本超 30%,某任务组高峰期跨专线流量降低 70%。

值得关注:

  • QBFS 是虚拟文件系统层,屏蔽 HDFS 和多种公有云对象存储的差异,提供统一命名空间。
  • 支持表级和时间分区的透明迁移,业务无需修改应用程序。
  • 基于 Alluxio 构建混合云缓存,某任务组高峰跨专线流量降低 70%。

这篇内容更值得关注的原因在于,它不是纸上谈兵的架构设计稿——爱奇艺的混合云存储已经全面落地并产生了可量化的降本效果。这种「先屏蔽差异、再透明迁移、最后智能缓存」的渐进式混合云策略,对任何做大数据的团队都有参考价值。

2. 腾讯混元 AI Infra 进化:HPC-Ops 推理核心算子全面升级

腾讯混元 AI Infra 团队升级了开源推理算子库 HPC-Ops,新增五大核心算子,针对大模型推理中的关键瓶颈进行专项优化。动态负载调度方案解决 Attention 长尾延迟问题,长文本场景加速达 2.95x;双 BF16 GEMM 组合模拟 FP32 精度,精度优于 TF32 且性能最高提升 3.22x;FusedMoE 整合 MoE 多阶段流程,相比 vLLM 性能提升 1.2x-1.6x;Fused AllReduce+Norm 深度融合通信与归一化,性能提升 1.04x-1.68x;Sampler 融合多个 Kernel,相比 vLLM 提速 4.0x-7.5x。所有算子已全面开源。

值得关注:

  • 动态负载调度方案解决 Attention 长尾延迟,长文本加速 2.95x。
  • 双 BF16 GEMM 组合模拟 FP32 精度,精度优于 TF32,性能最高提升 3.22x。
  • FusedMoE 相比 vLLM 性能提升 1.2x-1.6x,Sampler 融合 Kernel 提速 4.0x-7.5x。

这篇内容更值得关注的原因在于,它提供了每项优化的具体量化性能数据,并且已经全面开源。如果你在跑大模型推理服务,这些算子的提升可以直接对标自己的性能瓶颈。

3. 一文读懂什么是 Loop,Claude Fable 5 是 Loop 最严厉的父亲

Loop 工程是一种通过设计循环结构替代手动提示让 AI 迭代执行任务的方法,核心思想是人从执行者变为系统设计者。五大模块包括自动化调度(独立调度器控制循环频率和优先级)、工作树隔离(并行探索不同方案)、Skill(封装可复用能力)、插件与连接器(对接外部工具)和子 Agent(分工协作),其中记忆机制是长期运行的关键。文章还引入了 /goal 指令——由独立模型判断目标是否达成而非执行 Agent 自评,大幅提升可靠性。在 Parameter Golf 实验中,Fable 5 对训练流程的改进幅度约是 Opus 4.7 的 6 倍,且更擅长结构性改动。

值得关注:

  • Loop 工程的核心是设计循环结构而非手动提示,人从执行者变为系统设计者。
  • /goal 指令由独立模型判断完成,而非执行 Agent 自评——这是 Hermes 也支持的特性。
  • Fable 5 对训练流程改进幅度约是 Opus 4.7 的 6 倍,但存在安全风险争议。

这篇内容更值得关注的原因在于,它解析的 Loop 工程模式其实和我们用 Hermes 时遇到的很多问题直接相关——如何让 Agent 持续迭代、如何用 /goal 设定目标、如何通过 Skill 封装可复用能力。适合对照自己的实践来反思。

趋势观察

  1. 大型互联网公司的基础设施建设正在全面进入「混合云 + 开源化」阶段。爱奇艺的 QBFS 和腾讯的 HPC-Ops 都是自研后开源,说明内部工具外部化正在成为大厂的标配策略。
  2. 大模型推理的优化正在从粗粒度的框架级优化走向细粒度的算子级优化。HPC-Ops 的五个算子每个都针对特定瓶颈做专项突破,这种「精确打击」的思路比通用优化更有效。
  3. Loop 工程正在成为 Agent 开发的默认范式。从 Claude Code 的 /goal 到 Hermes 的 /goal 指令,让 Agent 从「一次问答」进化到「持续迭代」的模式正在标准化。

延伸阅读