面向流程体系构建AI资产

从能力空心化到可演进的Skill体系
基于Anthropic官方Skill标准(2025年10月发布)
适用于所有已部署智能体平台的企业

什么是Skill?官方技术定义

"Skill是一种模块化、可复用的能力包,用于将特定任务的专业知识、工作流程和可执行逻辑进行结构化封装,使AI在执行该类任务时具备稳定、一致且可持续演进的行为能力。"
—— Anthropic官方,2025年10月16日发布
Skill = AI的SOP
不是模型参数,不是Prompt,不是黑盒工具
而是清晰、可读、可维护的文件结构
📁 my-skill/
├── 📄 SKILL.md      (使用说明+执行流程)
├── 📜 scripts/        (可执行脚本)
├── 🎨 templates/      (模板/示例)
└── 📚 references/    (规则库/资源)

Skill为什么比Prompt和Tool更优?

Prompt是一次性的对话技巧,Skill是可复用的操作知识
它记录的不是"你怎么说",而是"事情应该怎么做"

🧠 不占用上下文

采用"按需加载"方式
默认只暴露必要元信息
任务需要时才读取完整内容
可同时拥有上百个Skill

📝 可维护

Skill是文件
文件可以版本控制
可以回滚、演进、审计
可预测、可复制、可传承

💡 知识沉淀

不是"聪明",而是经验的封装
从"每次解释"到"一次封装,处处调用"
让AI从聪明新人变成行业专家

AI Agent在企业中的真实使用现状

使用率正在加速增长,但从实验到大规模落地之间存在巨大鸿沟
88% 组织至少在1个业务职能中使用AI McKinsey, Nov 2025
79% 公司表示AI Agent已在组织中adopt PwC, Jun 2025
62% 组织处于实验阶段,仅23%在规模化 McKinsey, Nov 2025
~2/3 组织仍在实验/试点,仅1/3真正规模化 McKinsey, Nov 2025
问题不是没有AI Agent
是62%停留在实验阶段,仅23%真正规模化
缺少的是可复用的专业能力沉淀机制

为什么Agent"不好用"?

Agent的问题不在智能,而在"专业性"——像一个极其聪明但毫无行业经验的新人
❌ 当前困境
每次对话都要反复解释背景
手把手教流程,不断纠错
"这次记住了,下次又忘了"
专业知识无法沉淀
✅ Skill解决方案
一次封装,永久复用
稳定、一致、可预测的行为
版本控制、可回滚、可审计
让AI从聪明新人变成十年经验专家
"看病时,你会选IQ 300的天才,还是做了十年临床的一线医生?
Agent今天更像前者——聪明,但不稳定、不一致、不可复用。"
—— Anthropic Skill构建指南

为什么必须面向"业务流程"来建设Skill?

流程是组织唯一客观、完整、可验证的能力地图
✅ 按流程建设
稳定性:流程年更,岗位/系统月更
完整性:What+Who+How自动覆盖全景
可验证:覆盖率=已封装节点/总节点
可复用:相同节点天然支持跨域共享
❌ 按岗位/系统建设
不稳定:岗位调整、系统升级,全部重来
不完整:人为划分,必然遗漏
不可验证:建了多少?还差多少?不知道
不可复用:法务建的合同解析,采购用不了
锚定流程 = 锚定长期资产

核心转变:从"死资产"到"活资产"

过去的流程文件是"废物",今天的Skill是"活资产"
❌ 流程文件(死资产)
写来束之高阁,没人看
建系统时参考一下,或扯皮时拿出来
被人看了一次之后,你怎么知道用得怎么样?
完全不知道!培训时用一用,没有别的用途
✅ Skill(活资产)
直接被系统调用,每次调用产生记录
实际运行的资产 + 留下完整数据
可度量:调用量、成功率、节省工时
可管理:谁在用?用得怎样?是否需要优化?
流程文件是"写给人看的"
Skill是"给AI调用的"
从静态文档 → 动态资产 → 数据驱动治理

Skill带来的数据革命

每次调用都是一次数据沉淀,让组织真正知道"AI用得怎么样"
📊 AI渗透度
多少流程已Skill化?
📈 资产利用率
哪些Skill被高频调用?
💰 ROI度量
节省了多少工时?
🎯 质量监控
成功率、满意度趋势
以前:出了文件被人看了一次之后,你完全不知道这个文件被运用得怎么样
现在:每次调用都有记录,数据驱动持续优化

像管流程一样,约束着管Skill

流程管理的核心思想:标准化、可追溯、持续优化——完全适用于Skill治理
流程定义
SOP文档
流程执行
员工按SOP操作
流程监控
KPI/审计
流程优化
迭代SOP
⬇️ 同样的逻辑 ⬇️
Skill定义
标准化封装
Skill执行
AI/系统调用
Skill监控
调用数据/ROI
Skill优化
迭代版本

流程驱动的Skill建设:七阶闭环模型

不是线性项目,而是永续引擎——第7阶段的数据,直接驱动第1阶段更新
①流程测绘
L1-L3框架树
②节点解构
拆为原子Skill
③Skill封装
标准结构生成
④模型聚合
按岗位聚合
⑤分层治理
技术+规约+运营
⑥多模调用
人工/AI/系统
⑦数据反馈
健康度→ROI
反馈数据 → 流程树更新 → Skill优化 → 模型重组
形成组织能力的"新陈代谢"

Step 1:流程测绘——构建能力地图

不以岗位为边界,必须端到端、无截断、可追溯
L1 采购管理
L2 供应商准入
L3 资质文件合规性检查 ✓ 已封装
L3 信用评级评估 ✓ 已封装
L2 订单执行
L3 合同文本解析 ✓ 已封装
L3 风险条款识别 进行中
L3 审批流程跟进 未开始
流程覆盖率 = 已封装节点数 / 总节点数
100%可量化、可审计的建设进度标尺

Step 2:原子能力判定

一个Skill只做一件事——这是可复用、可编排、可验证的物理基础
单一职责
只做一件事
输入明确
PDF+规则库
输出可测
风险条款列表
独立运行
不依赖前序状态
❌ 不合格
"解析合同识别风险"
→ 含"并",需拆为两个Skill
✅ 合格
"文本解析" + "风险识别"
→ 两个独立Skill,各自可复用

避坑指南:3个最常见致命误区

❌ 误区1:把Skill当Prompt工具
"写周报+润色邮件+会议纪要"打包成一个大Skill
后果:无法被AI精准触发,激活率极低
✅ 正解:拆为独立Skill
每个Skill只解决一个L3流程节点
可单独度量、可独立优化
❌ 误区2:用"岗位"命名Skill
法务部vs采购部各建一套合同解析
后果:重复建设,能力割裂
✅ 正解:按业务对象+动作命名
contract.text-parse(剥离组织归属)
命名即治理,强制领域本体注册
❌ 误区3:用"使用次数"衡量价值
邮件草稿TOP1,增值税核算被边缘化
后果:核心风控类缺乏投入
✅ 正解:多维价值权重模型
调用量0.2 + 节省工时0.3 + 合规等级0.3
引导资源投向关键战场

分阶段实施路径:从试点到规模化

不要试图一步到位,用"小胜"建立组织信心
第一阶段(1-2个月):试点验证
选择1个核心流程 → 完成L1-L3测绘 → 封装5-10个高优Skill → 验证ROI
第二阶段(3-4个月):模式复制
扩展至3-5个流程 → 建立治理机制 → 发布能力图谱1.0 → 形成标准化手册
第三阶段(5-6个月):组织推广
全公司流程覆盖 → 签署治理宪章 → 建立CSO角色 → Skill数突破100,跨域复用率>30%

核心回顾

流程即地图,节点即原子,封装即沉淀

1️⃣ Skill是AI的SOP

Anthropic 2025年10月发布的开放标准
模块化、可复用、可演进的能力包

2️⃣ 62%企业停留在实验阶段

仅23%真正规模化(McKinsey 2025.11)
缺的是专业能力沉淀机制

3️⃣ 流程是唯一能力地图

锚定流程=锚定长期资产
稳定、完整、可验证、可复用

4️⃣ 从死资产到活资产

流程文件束之高阁 vs Skill被调用+产生数据
每次调用都有记录,数据驱动优化

5️⃣ 像管流程一样管Skill

标准化、可追溯、持续优化
约束着管,治理先行

6️⃣ 领导力比技术更重要

CSO任命/预算/治理宪章
组织承诺比技术方案更重要

谢谢

面向流程体系构建AI资产:从能力空心化到可演进的Skill体系
数据来源:Anthropic官方文档(2025.10)、McKinsey(2025.11)、PwC(2025.6)、Gartner(2025.8)