今日概览
Google I/O 2026 是今天的绝对主角——Gemini 3.5 Flash 性能超越旗舰、Antigravity 2.0 让操作系统开发压缩到千元级、Spark 个人 Agent 正式上线,三个维度同时展示了 Google 在模型、编程平台和消费级 AI 上的全面提速。与此同时,得物技术分享了 Claude Code Harness 工程在数仓场景下的落地经验,用工程手段把 AI 代码生成的不稳定因素锁死在规范框架内。两条线索的交汇点是同一个问题:当模型能力足够强之后,真正的瓶颈在哪里?
今日重点
1. 帮大家总结了一下凌晨的 Google I/O 2026 开发者大会
来源:数字生命卡兹克
一篇对 Google I/O 2026 发布会的高密度梳理,覆盖 Gemini 3.5 Flash、Omni Flash 多模态模型、Antigravity 2.0 开发平台、Spark 个人代理和 Universal Cart 购物体验等全线更新。文章用简洁的节奏把技术发布串联成可理解的故事线,适合快速建立对 I/O 全貌的认知。
值得关注:
- Gemini 3.5 Flash 在编码和 Agent 能力上超越上一代 Pro 模型,速度提升 4 倍而价格减半。
- Antigravity 2.0 升级为独立桌面应用 + CLI + SDK 全能平台,可用 93 个子代理并行协作。
- Spark 是 Google 推出的个人 AI Agent,7×24 小时托管于云端,支持定时任务与跨设备同步。
这篇内容更值得关注的原因在于,它是一次完整而非碎片化的发布解读——从模型底层到消费者面全部涵盖,能帮助读者建立起对 Google 2026 AI 战略的结构性理解,而不是只看到某个孤立技术点的爆款截图。
2. Claude Code Harness 工程:数仓侧落地方案
来源:得物技术
得物技术团队分享了他们在数仓场景中使用 Claude Code 时遇到的典型困境——上下文遗忘、规范不稳定、大 Token 操作影响 Compact——以及他们如何通过一套 Harness 工程体系将 AI 从"对话辅助"升级为"规则驱动的自动化流程"。
值得关注:
- PostToolUse Hook 机制在每次写 SQL 后自动触发规范检查,规范遵守率从 70-80% 提升到 95% 以上。
- Subagents 在独立上下文里执行血缘查询、自测等高 Token 操作,主 context 仅接收摘要,Compact 触发频率预计降低 50-70%。
- CLAUDE.md 持久化跨会话信息 + Hooks 确定性规范检查 + Subagents 隔离长任务,形成职责分层架构。
这篇内容更值得关注的原因在于,它解决的是一个非常现实的工程问题——AI 模型本身的能力已经足够好,但如何让它持续稳定地输出高质量代码,才是团队真正需要面对的挑战。Harness 方案提供了一套可复用的治理思路。
3. Agent 的下半场,是账单
来源:赛博禅心 · 对话 OpenClacky 李亚飞
一篇关于 AI Agent 成本控制的深度对话。OpenClacky 创始人李亚飞分享了他们如何通过上下文调优将缓存命中率推至近 100%,相比同类框架 Token 消耗降低 50% 以上,甚至仅为 1/6。这种极致的成本控制让个人开发者也能以微利存活,催生了"一人公司"模式。
值得关注:
- 缓存命中率接近 100%,通过上下文结构设计和复用策略实现——核心思路不是压缩内容,而是让每次请求都能命中已有缓存。
- 仅 16 个核心工具,通过元工具设计大幅减少请求次数和 Token 开销,而非盲目增加工具数量。
- 成本优化至极致后,AI Agent 不再是大公司的专属游戏,个人开发者也能在低利润下持续运营。
这篇内容更值得关注的原因在于,它从"账单"这个非常务实的角度切入 AI Agent 行业——大部分讨论都在讲能力上限,很少有人认真算账。而成本往往是决定产品能否长期存活的底层变量。
趋势观察
- Google I/O 2026 标志着 AI 竞争进入第二阶段。 模型性能已经不是唯一战场——Gemini 3.5 Flash 的性价比策略、Antigravity 2.0 的全栈 Agent 平台、Spark 的消费者级 Agent 落地,三条线说明 Google 想要的不只是最好的模型,而是最好的"AI 使用方式"。
- 工程化正在成为 AI 落地的真正瓶颈。 得物技术的 Harness 方案和 OpenClacky 的成本优化策略不约而同地指向同一个方向:模型能力足够之后,稳定性和成本才是决定产品能否规模化运行的关键。
- “模型够用"时代正在到来。 当大家都能用上同样强大的模型时,差异化开始从"谁的模型更好"转向"谁的系统设计更扎实、谁的工程链条更可靠、谁的运营成本更低”。