面向流程体系构建AI资产

从能力空心化到可演进的Skill体系

基于Anthropic官方Skill标准（2025年10月发布）
适用于所有已部署智能体平台的企业

什么是Skill？官方技术定义

"Skill是一种模块化、可复用的能力包，用于将特定任务的专业知识、工作流程和可执行逻辑进行结构化封装，使AI在执行该类任务时具备稳定、一致且可持续演进的行为能力。"

—— Anthropic官方，2025年10月16日发布

Skill = AI的SOP
不是模型参数，不是Prompt，不是黑盒工具
而是清晰、可读、可维护的文件结构

📁 my-skill/
├── 📄 SKILL.md      （使用说明+执行流程）
├── 📜 scripts/        （可执行脚本）
├── 🎨 templates/      （模板/示例）
└── 📚 references/    （规则库/资源）

Skill为什么比Prompt和Tool更优？

Prompt是一次性的对话技巧，Skill是可复用的操作知识
它记录的不是"你怎么说"，而是"事情应该怎么做"

🧠 不占用上下文

采用"按需加载"方式
默认只暴露必要元信息
任务需要时才读取完整内容
可同时拥有上百个Skill

📝 可维护

Skill是文件
文件可以版本控制
可以回滚、演进、审计
可预测、可复制、可传承

💡 知识沉淀

不是"聪明"，而是经验的封装
从"每次解释"到"一次封装，处处调用"
让AI从聪明新人变成行业专家

AI Agent在企业中的真实使用现状

使用率正在加速增长，但从实验到大规模落地之间存在巨大鸿沟

88% 组织至少在1个业务职能中使用AI McKinsey, Nov 2025

79% 公司表示AI Agent已在组织中adopt PwC, Jun 2025

62% 组织处于实验阶段，仅23%在规模化 McKinsey, Nov 2025

~2/3 组织仍在实验/试点，仅1/3真正规模化 McKinsey, Nov 2025

问题不是没有AI Agent
是62%停留在实验阶段，仅23%真正规模化
缺少的是可复用的专业能力沉淀机制

为什么Agent"不好用"？

Agent的问题不在智能，而在"专业性"——像一个极其聪明但毫无行业经验的新人

❌ 当前困境

每次对话都要反复解释背景
手把手教流程，不断纠错
"这次记住了，下次又忘了"
专业知识无法沉淀

✅ Skill解决方案

一次封装，永久复用
稳定、一致、可预测的行为
版本控制、可回滚、可审计
让AI从聪明新人变成十年经验专家

"看病时，你会选IQ 300的天才，还是做了十年临床的一线医生？
Agent今天更像前者——聪明，但不稳定、不一致、不可复用。"

—— Anthropic Skill构建指南

为什么必须面向"业务流程"来建设Skill？

流程是组织唯一客观、完整、可验证的能力地图

✅ 按流程建设

稳定性：流程年更，岗位/系统月更
完整性：What+Who+How自动覆盖全景
可验证：覆盖率=已封装节点/总节点
可复用：相同节点天然支持跨域共享

❌ 按岗位/系统建设

不稳定：岗位调整、系统升级，全部重来
不完整：人为划分，必然遗漏
不可验证：建了多少？还差多少？不知道
不可复用：法务建的合同解析，采购用不了

锚定流程 = 锚定长期资产

核心转变：从"死资产"到"活资产"

过去的流程文件是"废物"，今天的Skill是"活资产"

❌ 流程文件（死资产）

写来束之高阁，没人看
建系统时参考一下，或扯皮时拿出来
被人看了一次之后，你怎么知道用得怎么样？
完全不知道！培训时用一用，没有别的用途

✅ Skill（活资产）

直接被系统调用，每次调用产生记录
实际运行的资产 + 留下完整数据
可度量：调用量、成功率、节省工时
可管理：谁在用？用得怎样？是否需要优化？

流程文件是"写给人看的"
Skill是"给AI调用的"
从静态文档 → 动态资产 → 数据驱动治理

Skill带来的数据革命

每次调用都是一次数据沉淀，让组织真正知道"AI用得怎么样"

📊 AI渗透度
多少流程已Skill化？

📈 资产利用率
哪些Skill被高频调用？

💰 ROI度量
节省了多少工时？

🎯 质量监控
成功率、满意度趋势

以前：出了文件被人看了一次之后，你完全不知道这个文件被运用得怎么样
现在：每次调用都有记录，数据驱动持续优化

像管流程一样，约束着管Skill

流程管理的核心思想：标准化、可追溯、持续优化——完全适用于Skill治理

流程定义
SOP文档

→

流程执行
员工按SOP操作

→

流程监控
KPI/审计

→

流程优化
迭代SOP

⬇️ 同样的逻辑 ⬇️

Skill定义
标准化封装

→

Skill执行
AI/系统调用

→

Skill监控
调用数据/ROI

→

Skill优化
迭代版本

流程驱动的Skill建设：七阶闭环模型

不是线性项目，而是永续引擎——第7阶段的数据，直接驱动第1阶段更新

①流程测绘
L1-L3框架树

→

②节点解构
拆为原子Skill

→

③Skill封装
标准结构生成

→

④模型聚合
按岗位聚合

⑤分层治理
技术+规约+运营

→

⑥多模调用
人工/AI/系统

→

⑦数据反馈
健康度→ROI

反馈数据 → 流程树更新 → Skill优化 → 模型重组
形成组织能力的"新陈代谢"

Step 1：流程测绘——构建能力地图

不以岗位为边界，必须端到端、无截断、可追溯

L1 采购管理

L2 供应商准入

L3 资质文件合规性检查 ✓ 已封装

L3 信用评级评估 ✓ 已封装

L2 订单执行

L3 合同文本解析 ✓ 已封装

L3 风险条款识别进行中

L3 审批流程跟进未开始

流程覆盖率 = 已封装节点数 / 总节点数
100%可量化、可审计的建设进度标尺

Step 2：原子能力判定

一个Skill只做一件事——这是可复用、可编排、可验证的物理基础

① 单一职责
只做一件事

② 输入明确
PDF+规则库

③ 输出可测
风险条款列表

④ 独立运行
不依赖前序状态

❌ 不合格

"解析合同并识别风险"
→ 含"并"，需拆为两个Skill

✅ 合格

"文本解析" + "风险识别"
→ 两个独立Skill，各自可复用

避坑指南：3个最常见致命误区

❌ 误区1：把Skill当Prompt工具

"写周报+润色邮件+会议纪要"打包成一个大Skill
后果：无法被AI精准触发，激活率极低

✅ 正解：拆为独立Skill

每个Skill只解决一个L3流程节点
可单独度量、可独立优化

❌ 误区2：用"岗位"命名Skill

法务部vs采购部各建一套合同解析
后果：重复建设，能力割裂

✅ 正解：按业务对象+动作命名

contract.text-parse（剥离组织归属）
命名即治理，强制领域本体注册

❌ 误区3：用"使用次数"衡量价值

邮件草稿TOP1，增值税核算被边缘化
后果：核心风控类缺乏投入

✅ 正解：多维价值权重模型

调用量0.2 + 节省工时0.3 + 合规等级0.3
引导资源投向关键战场

分阶段实施路径：从试点到规模化

不要试图一步到位，用"小胜"建立组织信心

第一阶段（1-2个月）：试点验证

选择1个核心流程 → 完成L1-L3测绘 → 封装5-10个高优Skill → 验证ROI

第二阶段（3-4个月）：模式复制

扩展至3-5个流程 → 建立治理机制 → 发布能力图谱1.0 → 形成标准化手册

第三阶段（5-6个月）：组织推广

全公司流程覆盖 → 签署治理宪章 → 建立CSO角色 → Skill数突破100，跨域复用率>30%

核心回顾

流程即地图，节点即原子，封装即沉淀

1️⃣ Skill是AI的SOP

Anthropic 2025年10月发布的开放标准
模块化、可复用、可演进的能力包

2️⃣ 62%企业停留在实验阶段

仅23%真正规模化（McKinsey 2025.11）
缺的是专业能力沉淀机制

3️⃣ 流程是唯一能力地图

锚定流程=锚定长期资产
稳定、完整、可验证、可复用

4️⃣ 从死资产到活资产

流程文件束之高阁 vs Skill被调用+产生数据
每次调用都有记录，数据驱动优化

5️⃣ 像管流程一样管Skill

标准化、可追溯、持续优化
约束着管，治理先行

6️⃣ 领导力比技术更重要

CSO任命/预算/治理宪章
组织承诺比技术方案更重要

谢谢

面向流程体系构建AI资产：从能力空心化到可演进的Skill体系

数据来源：Anthropic官方文档（2025.10）、McKinsey（2025.11）、PwC（2025.6）、Gartner（2025.8）