今日概览

今天的候选围绕三条主线展开:一是 Agent 工程化从理论走向落地,阿里云开发者连续两篇深度文章分别从 Harness 驾驭工程和 Skill 扩展规范切入,提供了可操作的架构指引;二是 AI 原生商业生态开始成形,ChatGPT 广告投放的实操指南揭示了全新的用户触达渠道;三是跨端开发效率正在被 AI 编程工具重构。此外脑机接口开源和 AI 数据产业的现实面也带来了有价值的补充视角。

今日重点

1. 给野马套上缰绳:Agent Harness 工程实践 —— 从范式理论到钉钉 AI 招聘的真实落地

文章提出 Agent = Model + Harness 的核心公式,明确指出优化 Agent 系统的最佳杠杆在于 Harness(驾驭工程),而非一味追求更强大的模型。作者结合钉钉悟空 AI 招聘的真实案例,提炼出四条反直觉铁律:上下文越少越好(精选而非堆砌)、专才 Agent 永远优于通才(工具隔离是关键)、状态写入文件而非上下文窗口、能写成 Linter 的约束不应停留在文档。文章还配套了六个可复用的工程模式。

值得关注:

  • Agent 优化的真正瓶颈是 Harness 设计,不是模型能力天花板。
  • 专才架构下工具隔离和上下文精减是提升可控性的两个最有效手段。
  • 钉钉 AI 招聘案例完整演示了从理论到落地的全路径。

这篇内容更值得关注的原因在于,它把 Agent 工程从"调 Prompt 和换模型"的泥潭中拉了出来,给出了系统性的架构设计原则和真实落地验证。对任何一个正在构建 Agent 系统的团队来说,Harness 视角都是当前最被低估的优化方向。

2. Harness 工程之道:Skill 原理与最佳实践

这篇文章与上一篇同属阿里云开发者团队、同属 Harness 工程系列,但聚焦在 Agent Skills 这一具体能力扩展规范上。文章从 trade-ab-skill 项目出发,系统讲解了 Skill 的结构、渐进性披露设计、自动触发机制和作用域优先级。核心洞见是:SKILL.md 应该是路由器而非知识仓库——它负责按需加载和分发任务,而不是把所有知识塞进一个文件。

值得关注:

  • 渐进性披露是 Skill 体系的核心设计,按需加载知识以降低上下文成本。
  • Description 字段是自动触发匹配的关键开关,需要同时写明功能与触发场景。
  • 四级作用域(企业 / 个人 / 项目 / Plugin)支持不同粒度复用,冲突按策略处理。

这篇内容更值得关注的原因在于,它完整填补了 Skills 从概念到工程落地的断层——不只是告诉你有这个规范,而是教你怎么写出真正可复用的 Skill。对于 Hermes 日常运营来说,Skill 设计原则直接影响了技能质量。

3. AI + Kuikly:7.5 小时落地三端「多模态聊天 App」实战

腾讯技术工程团队展示了一个令人印象深刻的效率实证:用 28 轮对话、740 字自然语言描述,AI 生成了约 3500 行代码,7.5 小时交付了一个支持文本 / 图片 / 拍照 / 流式回复的三端(iOS / Android / 鸿蒙)多模态聊天 App。AI 借助 Skills 和 Rules 学会了 Kuikly 框架知识,自动选择并复用了 6 个现有组件,还自主扩展了 SSE 长连接和图片压缩模块。

值得关注:

  • 传统三端开发需 30 人天,Kuikly 手写需 7.5 人天,AI + Kuikly 仅 7.5 小时。
  • AI 自主定位并修复了相册缩略图加载问题(content:// URI 未处理),使用了 logcat + adb 分析。
  • 多次迭代处理键盘遮挡、鸿蒙会话不生效等细节问题,最终三端真机通过。

这篇内容更值得关注的原因在于,它是目前看到的 AI 辅助客户端开发最有说服力的效率实证——从生成代码到自主修复 bug,再到三端真机验证,完整展示了"AI + 跨端框架"这个组合能够达到的真实水平。

4. 如何在 ChatGPT 中投放广告?

这是当前中文互联网中关于 ChatGPT 广告投放最详尽的实操指南。文章完整覆盖了投放流程、定价策略、人群定向机制和效果数据:ChatGPT 广告位的点击率约为普通聊天机器人的 10 倍,广告系统不依赖关键词竞价,而是通过上下文线索匹配对话场景。非美国广告主需通过 OpenAI 授权的官方代理接入,创意改动会触发重新审核(耗时数天)。

值得关注:

  • ChatGPT 广告的 CPC 和 CPM 数据对比,效果数据优于传统社交广告。
  • 广告系统上下文匹配机制的工作原理,与传统搜索广告完全不同。
  • AI 工具、3C、跨境电商和游戏是当前投放效果最好的行业。

这篇内容更值得关注的原因在于,ChatGPT 广告作为一个全新渠道,目前中文信息极度稀缺。对于做出海产品的团队来说,这篇文章提供的操作流程和效果基准是当前能找到的最完整的参考资料。

5. Meta 把大模型塞进脑机接口:Brain2Qwerty v2 全开源

Meta 发布了 Brain2Qwerty v2,采用非侵入式脑磁图(MEG)记录配合端到端深度学习,实现实时句子级解码。单词准确率 61%,表现最佳的参与者达到 78%,超过一半的句子仅错一个词或完全正确——性能已逼近侵入式方案。Meta 已开源了 v1 和 v2 的完整训练代码和配套数据集。

值得关注:

  • 非侵入式方案(无需开颅)准确率逼近侵入式水平,这是重要里程碑。
  • 端到端深度学习直接从原始脑信号解码,摆脱了手工特征工程的限制。
  • 完整开源代码和数据集,降低了脑机接口研究的参与门槛。

这篇内容更值得关注的原因在于,Meta 选择了一条与 Neuralink 完全不同的技术路线(非侵入式 + 开源),且取得了令人信服的结果。这个方向如果能持续进步,将大幅降低脑机接口技术的临床和消费级应用门槛。

6. 给机器人打工了一天:AI 时代最魔幻的工作

一篇实地体验文章,作者应聘了具身智能机器人的数据采集员。面试需要量手掌尺寸、问身高体重,日薪约 200–250 元。工作内容高度重复——分拣积木、叠纸杯,分遥操作和无机器人示教两种模式。文章揭示了一个容易被忽视的现实:最先进的 AI 技术背后,是一群做着重复劳动、日结工资的普通人在默默支撑。

值得关注:

  • 数据采集是具身智能发展的隐性瓶颈,这个岗位正在快速扩张。
  • 日薪 200-250 元的工作条件与 AI 行业的高估值形成鲜明对比。
  • 遥操作数据采集比纯示教方式更高效但也更消耗人力。

这篇内容更值得关注的原因在于,它提供了一个稀缺的底层视角——我们讨论 AI 进展时很少想到,这些模型的训练数据来自哪里、由谁以什么代价生产。这种社会层面的观察,与技术讨论同样值得关注。

趋势观察

  1. Agent 工程化正在取代调模型成为竞争焦点。 今天两篇深度文章都在讲 Harness / Skills,说明行业共识正在从"模型能力竞赛"转向"系统设计竞争"。
  2. AI 与跨端框架的结合展现出真实的效率突破。 7.5 小时三端交付不只是个案,Skills + Rules 的机制让 AI 可以快速学习新框架,这可能会改写客户端开发的成本结构。
  3. AI 商业生态开始形成新渠道。 ChatGPT 广告作为一个全新的流量池,其投放机制和效果基准值得出海团队提前研究。

延伸阅读