今日概览

今日候选围绕 AI Agent 工程化的多个落地维度展开：大淘宝技术提出了将 Agent Skill 视为"行为编程"的设计理念；得物技术分享了 AI Native 的 UI 自动化测试框架；字节跳动推出了 SkillScan 全链路安全扫描方案；腾讯技术工程则从成本视角系统性地探讨了 Token 治理。四条线索共同指向一个趋势——Agent 的规模化应用正在倒逼工程化的全面升级。

今日重点

1. AI Agent 的 Skill 系统设计

大淘宝技术团队系统阐述了 AI Agent Skill 系统的设计理念与工程实践。核心观点是将 Skill 视为行为编程而非普通文档——每个 Skill 都需要预设代理的失败模式，通过结构化设计（YAML+Markdown、DOT 流程图、检查表）和严格约束机制（门控、防御、说服原则）来规范代理行为。同时提出了按上下文预算分层加载的渐进披露策略以控制 Token 消耗，以及基于 TDD 理念的前向测试验证方法。

值得关注：

Skill 被定义为行为编程，需要预设代理的失败模式，这是与传统文档的本质区别。
通过门控、合理化防御和说服原则三层约束机制强制代理行为合规。
按上下文预算分层加载的渐进披露策略，是控制 Token 消耗的关键设计。

这篇内容更值得关注的原因在于，它将 Skill 设计从"写文档"升级到"编程行为"，这个视角转换对整个 Agent 开发范式有着深远影响——如果你还在把 Skill 当 README 写，这篇文章会颠覆你的认知。

2. AI UITester：AI Native 的 UI 自动化测试新范式

得物技术团队发布了 AI UITester，一个完全 AI Native 的 UI 自动化测试框架。核心突破在于视觉驱动替代代码驱动——测试用例由 AI 自动生成和维护，不再需要人工编写繁琐的选择器脚本。框架支持 AI 智能调试与自愈、VLM 驱动的跨平台统一，以及多 Agent 协作工作流。实际落地数据显示，单次 AI 调试用例成功率从 33% 提升到 68.4%，整体提效约 4 倍。

值得关注：

AI 智能调试自适应 UI 变化，不需要人工维护测试脚本。
VLM（视觉语言模型）驱动的跨平台统一意味着同一套逻辑覆盖 Android/iOS/Web。
多 Agent 协作工作流将测试任务拆解为认知、验证、监听等子任务，各 Agent 各司其职。

这篇内容更值得关注的原因在于，它指向了测试工程的一个范式级转折——测试的未来不是更聪明的选择器，而是不再需要选择器。视觉驱动的自愈测试可能是比 AI 写代码更早成熟的领域。

3. SkillScan 智能体技能安全扫描最佳实践

字节跳动技术团队推出了 SkillScan——面向 AI Agent 技能包的全链路安全检测方案，覆盖包体合规、声明安全、代码检测、网络分析和供应链审计五大风险领域。文章详细阐述了多层次检测体系的设计思路，以及 IDE 插件、CI/CD 门禁、平台周期性扫描三种接入模式，并总结了技能安全开发的最佳实践。

值得关注：

五大风险领域的覆盖范围：包体、声明、代码、网络、供应链。
三种接入模式覆盖了"开发期→提交期→运行期"全生命周期。
安全开发最佳实践直接写在 IDE 插件中，实现"边写边检"的实时反馈。

这篇内容更值得关注的原因在于，Agent 技能的供应链安全正在变成一个被忽视但日益紧迫的问题。当人人都能创建和分享技能包时，扫描与治理能力的配套就是必需品而非奢侈品。

4. 五块钱如何花三天：Token 成本治理的工程实践

腾讯技术工程分享了一篇关于 Token 成本治理的系统性思考。核心论点是Token 成本治理不能依赖临时节流，而需系统化工程。文章通过识别四类浪费（无效上下文、重复计算、过度规划、冗余诊断），区分有效与低效消耗，提出了构建可观测、可沉淀的平台能力。一个真实案例：某个大模型应用上线半年后，Token 消耗从日均 2 亿增涨到 56 亿，涨幅 28 倍——而功能迭代带来的实际收益并未同比例增长。

值得关注：

Token 浪费分四类：无效上下文、重复计算、过度规划、冗余诊断。
系统的 Token 治理需要可观测性基建——没有数据就没办法优化。
治理能力需要平台化沉淀为 Skill、路由策略等可复用资产。

这篇内容更值得关注的原因在于，它把 Token 成本的话题从"省几个钱"拉到了"系统工程"的高度。当你的 Agent 日消耗从 2 亿涨到 56 亿时，靠手调 Prompt 是救不了的——你需要的是架构级的治理能力。

趋势观察

Agent 工程化正在全面铺开。 今天的四篇文章分别覆盖了技能设计、自动化测试、安全扫描和成本治理，说明行业已经从"怎么让 Agent 跑起来"进入"怎么规模化地用好 Agent"阶段。
原本对立的开发范式开始融合。 视觉驱动的测试、行为编程的 Skill、全链路安全扫描——这些都在重塑软件开发的基础设施，AI Agent 既是工具也是被治理的对象。
成本治理正在从"事后算账"转向"架构设计"。 Token 成本不应该是上线后才考虑的问题，而是系统和 Skill 架构设计时就要内建的能力。

AI 日报 · 2026-07-02

今日概览

今日重点

1. AI Agent 的 Skill 系统设计

2. AI UITester：AI Native 的 UI 自动化测试新范式

3. SkillScan 智能体技能安全扫描最佳实践

4. 五块钱如何花三天：Token 成本治理的工程实践

趋势观察

延伸阅读

今日概览#

今日重点#

1. AI Agent 的 Skill 系统设计#

2. AI UITester：AI Native 的 UI 自动化测试新范式#

3. SkillScan 智能体技能安全扫描最佳实践#

4. 五块钱如何花三天：Token 成本治理的工程实践#

趋势观察#

延伸阅读#

今日概览

今日重点

1. AI Agent 的 Skill 系统设计

2. AI UITester：AI Native 的 UI 自动化测试新范式

3. SkillScan 智能体技能安全扫描最佳实践

4. 五块钱如何花三天：Token 成本治理的工程实践

趋势观察

延伸阅读