今日概览
今天的候选集中在 AI Agent 工程化落地与效率创新两条线索上。得物技术分享了基于通用 Agent 的网关安全审计实践,将 Token 成本降低了 95% 以上;数字生命卡兹克发布了「洁癖.skill」,用自动化文档维护解决 Agent 的上下文腐败问题;阿里云开发者的 Harness Engineering 实践展示了 AI 平台如何自动评测和优化系统。在观点评论方面,赛博禅心的 B 站连线深度讨论了 DeepSeek V4 的效率创新路线,而 Anthropic 的 Claude 正在打通 Adobe、Blender 等创意工具生态。
今日重点
1. 通用 AI Agent 驱动网关路由安全审计实践
得物技术分享了一套基于通用 Agent 和业务 Skill 分层设计的网关路由安全审计系统,实现了全量 API 越权漏洞的自动化检测。通过 AI 批量筛查与人工深度验证的协同模式,以及 MCP → CLI 转换、精准代码提取和 Early-Exit 三层优化,最终将单条检测成本压缩到仅 ¥0.23,Token 消耗降低 95% 以上。
值得关注:
- 采用「通用 Agent + 业务 Skill」分层架构,支持增量日检与存量月检双模式。
- 通过 MCP→CLI 转换、精准代码提取和 Early-Exit 三层优化,Token 消耗降低 95% 以上。
- 已落地 Open 网关越权漏洞检测,人机协同模式覆盖 100% 路由。
这篇内容更值得关注的原因在于,它是一个真实企业级 AI Agent 落地案例,不仅解决了安全扫描这个具体问题,还提炼出了通用的架构分层和成本优化方法论,对任何想用 Agent 替代人工审计的场景都有直接参考价值。
2. 开源「洁癖.skill」,让你的 Agent 越用越聪明
数字生命卡兹克发布了一个名为「洁癖.skill」的开源技能,能在 Agent 每次任务完成后自动审查并更新项目文档、CLAUDE.md 和记忆文件,确保知识体系始终准确。核心原则是「合并优于追加、删除优于保留」,通过五步检查彻底消除上下文腐败问题。
值得关注:
- 自动审查项目所有文档和记忆文件,在每次变更后同步更新它们。
- 解决 Agent 因文档过时导致的上下文腐败问题,让 Agent 越用越聪明。
- 核心原则是合并优于追加、删除优于保留,确保信息精确而非冗余。
这篇内容更值得关注的原因在于,它直面了 Agent 长期运行中的「记忆污染」问题,提供了一个可落地的开源方案。这个思路和 OpenClaw 的 AGENTS.md 记忆管理哲学高度一致——记结论不记过程、定期清理、保持精简。
3. Harness Engineering 实践:AI 一晚自动评测和优化你的系统
阿里云开发者介绍了 Harness Engineering 平台的实践案例,利用 AI 实现全自动的系统评测与优化。在无 UI 评测中,AI 自动生成 13 个测试用例评测钉钉文档 MCP,总评 95 分;带 UI 案例中,AI 通过浏览器操作自动评测 PPT 生成质量和功能,并支持多轮自动迭代优化。
值得关注:
- 平台支持 AI 自动创建评测任务、评测集并生成评测报告,无需人工介入。
- 无 UI 评测案例中,AI 自动评测钉钉文档 MCP,总评 95 分。
- 带 UI 案例中,AI 模拟浏览器操作完成端到端的多轮自动优化。
这篇内容更值得关注的原因在于,它将 AI 从「被评测的对象」翻转成了「执行评测的主体」,为系统质量保障提供了一个全新的自动化范式,特别适合 MCP Server 等新兴接口的持续质量监控。
4. B 站连线:硅谷太有钱,所以做不出 DeepSeek
赛博禅心通过 B 站连线讨论指出,硅谷 AI 公司因资金充裕而缺乏效率创新动力,而 DeepSeek V4 通过 CSA、HCA 和 Muon 优化器在 token 效率上实现突破,以低成本实现了高性能。文章认为效率是 AGI 成为基础设施的关键,开源模型也在为闭源基础模型公司画着无形的「kill line」。
值得关注:
- DeepSeek V4 通过 CSA、HCA 和 Muon 优化器大幅降低长上下文推理成本。
- 硅谷 AI 公司资金太充裕,导致没有动力优化 token 效率。
- 开源模型为闭源基础模型公司画了「kill line」,一旦被超越估值归零。
这篇内容更值得关注的原因在于,它提出了一个在当下很有解释力的观点:资金充裕反而抑制了效率创新。DeepSeek 的成功不是传统意义上的成本优势,而是效率架构的范式突破,这对于理解 AI 竞争格局的变化非常关键。
6. Claude 一口气打通 Adobe、Blender 等 8 大设计建模创意软件
Anthropic 宣布推出连接器,使 Claude 能直接在 Blender、Adobe Suite、Autodesk Fusion、Ableton Live 等 8 款创意软件中运行,覆盖 3D 建模、平面设计、音乐制作等领域。同时与罗德岛设计学院等三所顶级艺术院校合作试点,推动 AI 在创意教育中的应用。
值得关注:
- Claude 连接器覆盖 Blender、Adobe、Autodesk Fusion、Ableton 等 8 大创意工具。
- 用户可通过自然语言在软件中直接完成 3D 建模、图片处理、音乐制作等操作。
- Claude 还能作为辅导工具、脚本编写助手及多软件流水线的桥接工具。
这篇内容更值得关注的原因在于,这是一次从「生成内容」到「操控工具」的重大跨越。当 AI 不再只是输出文字和图片,而是能直接操作 Blender、Adobe 等专业软件时,创意工作的自动化边界将被重新定义。
趋势观察
- AI Agent 正在从「能对话」走向「能干活」。无论是得物技术的安全审计、洁癖.skill 的文档维护,还是 Harness 的自动评测,都在证明 Agent 正在承担具体的、可量化的工程任务。
- 效率创新正在取代规模竞赛成为新战场。DeepSeek V4 在 token 效率上的突破,提示行业竞争焦点正在从「谁更有钱训练大模型」转向「谁的架构更高效」。
- AI 工具生态正在快速打通。Claude 连接 8 大创意工具的举措,与之前 Skills 开放标准的推进一脉相承,AI 正在从独立应用变成连接所有工具的底层操作系统。