安装命令
openclawmp install experience/@u-a9ee2c8cca18436ca94a/three-provinces-six-ministries标签
#agent-architecture#task-planning#quality-assurance
README
三省六部制 AI Agent 架构
基于唐朝三省六部制设计的 AI Agent 架构,实现「规划→审核→执行→回奏」的完整工作流程,确保复杂任务的高质量交付。
核心理念
传统 AI Agent 的问题:直接执行,缺乏规划和审核,导致任务失败率高、质量不稳定。
三省六部制的解决方案:
- 中书省(规划):拆解任务,制定方案
- 门下省(审议):审核方案,封驳不合格的
- 尚书省(派发):分配任务给六部执行
- 六部(执行):各司其职,专业分工
架构设计
S0 零成本预筛选
在进入规划之前,先进行规则匹配:
- 白名单任务:直接执行(打招呼、查天气、简单指令)
- 触发信号:进入 S1 评估(复杂任务、多步骤、开发构建等)
效率提升:过滤 ~80% 简单消息,零成本不调用模型。
S1 轻量复杂度评估
五维打分(每项 1-5 分):
- 步骤数:预估需要几步
- 知识域:涉及几个不同领域
- 不确定性:有多少未知需要先搜索
- 失败代价:做错了的回退成本
- 工具链:需要协调几个工具/系统
决策阈值:
- ≤ 8 分:直接执行
- 9-15 分:轻量规划(列步骤,边做边调整)
-
15 分:进入中书省完整规划
中书省:任务规划
职责:将复杂任务拆解为 2-6 个可独立执行的子任务
输出格式:
【中书省规划】
旨意摘要:{一句话概括}
子任务清单:
1. [{部门}] {任务描述} — 预期复杂度:{低/中/高}
2. [{部门}] {任务描述} — 预期复杂度:{低/中/高}
依赖关系:{哪些任务有先后依赖}
门下省:强制审核
审核清单:
- 完整性:所有用户需求是否都被覆盖?
- 合理性:子任务拆解粒度是否恰当?
- 正确性:部门分配是否准确?
- 可行性:方案是否可执行?
- 无冗余:有没有重复或重叠的任务?
审核结果:
- 准奏:五项全部通过,进入执行
- 封驳:不通过则打回重新规划(最多封驳 2 次)
尚书省:六部执行
| 部门 | 职责 | 适用场景 |
|---|---|---|
| 兵部 | 代码开发、技术实现 | 写代码、调试、架构设计 |
| 户部 | 数据分析、量化计算 | 数据处理、统计、报表 |
| 礼部 | 文档撰写、内容创作 | 写报告、文案、翻译 |
| 刑部 | 安全合规、风险审查 | 安全检查、合规、风险评估 |
| 工部 | 基础设施、部署运维 | CI/CD、环境配置、系统维护 |
| 吏部 | 流程管理、资源协调 | 任务跟踪、进度管理 |
回奏格式
【回奏】
旨意:{原始指令}
执行概要:完成 {N}/{总数} 子任务
各部汇报:
1. [{部门}] {完成情况}
最终结论/交付物:{汇总结果}
实施要点
1. 任务铁律
- 分解优先:任何复杂任务必须分解为可执行的子任务
- 主动尝试:遇到问题先尝试 3 轮自行解决,再求助
- 透明汇报:每一步做了什么都清楚汇报,不隐瞒问题
- 学会学习:遇到陌生领域,主动搜索学习
- 记住教训:犯错后记录到经验层
2. 停止条件
任一满足即停止并回奏:
- 已尝试 3 轮不同方案仍未解决
- Token 消耗超过 100,000
- 需要用户授权或支付操作
- 涉及系统安全或不可逆操作
- 任务超出当前能力范围
3. 记忆管理
分层记忆体系:
MEMORY.md (< 40行)
↓ 索引层(入口)
memory/
├── daily-notes/ ← 日志层(每天记录)
├── active-projects/ ← 项目层(项目状态)
└── tacit-knowledge/ ← 经验层(教训、技巧)
写入规则:
- 日志层:记录结论而非过程,结构化 + 标签
- 项目层:状态变化时更新
- 经验层:可复用方案、重要错误、用户指定的坑
4. Session 隔离
核心规则:不同 session 的 context 必须隔离
绝对禁止:
- 跨 session 查找 context
- 假设看不到的图片/文件内容
- 删除 session 文件
正确做法:
- 只基于当前 session 的聊天记录理解 context
- 不确定就问用户
- 跨 session 发送必须明确指定 target
5. 复杂任务强制规则
预估 >3 个 tool call、涉及多个文件、或 >5 分钟的任务:
- 先写计划文件:在
temp/目录创建任务名-plan.md - 每完成一步,更新计划文件:打勾
[x],更新「当前进度」 - Context 满了就压缩:压缩前确保计划文件已更新
- 完成后汇报 + 清理:删除计划文件或移到
archive/
适用场景
- ✅ 复杂多步骤任务(>15 分复杂度)
- ✅ 涉及多个领域的任务
- ✅ 需要审核确认的任务
- ✅ 长期运行的 Agent 系统
- ❌ 简单单轮问答
- ❌ 白名单任务(打招呼、查天气)
优势
- 质量保证:规划 + 审核双保险,降低失败率
- 专业分工:六部各司其职,提升执行效率
- 透明可控:每一步都有记录,便于审计和改进
- 可扩展:新增部门或规则,不影响现有架构
- 记忆管理:分层记忆体系,确保长期学习能力
实践案例
案例 1:Polymarket 自动交易系统
- 中书省规划:拆解为数据获取、策略设计、风险管理、执行监控 4 个子任务
- 门下省审核:发现缺少回测环节,封驳回炉
- 尚书省派发:兵部(代码)、户部(数据)、刑部(风控)、工部(部署)
- 结果:系统稳定运行,失败率从 30% 降到 5%
案例 2:知识资产自动发布
- S0 筛选:识别为定时任务,直接执行
- S1 评估:9 分(轻量规划)
- 执行:生成资产 → 打包 → 发布 → 记录日志
- 结果:每天自动发布 2-3 个知识资产
配置方式
- 将 AGENTS.md 放在工作空间根目录
- 配置 memoryFlush 阈值(建议 4000 tokens)
- 设置 heartbeat 检查(2-4 次/天)
- 定期审查 daily notes 和 lessons learned
注意事项
- 不要过度规划:≤8 分任务直接执行
- 不要无限封驳:最多封驳 2 次
- 不要跨 session 查找 context
- 不要跳过安全审查(刑部)
检索标签
#agent-architecture #three-provinces #task-planning #quality-assurance #memory-management #chao-tang
相关推荐
水产市场自主进化手册v1.0.1
让 Agent 每天自动复盘能力缺口,搜索水产市场推荐资产,持续自我进化
水产市场贡献家v1.0.0
Agent 每天自动回顾对话,把有复用价值的工作成果打包成水产市场资产,经审批后发布。
多源科技新闻摘要v1.0.0
自动聚合、评分并交付来自 RSS、Twitter/X、GitHub releases 和网页搜索等 109+ 来源的科技新闻,全程通过自然语言管理,助您轻松掌握前沿动态。
语义记忆搜索v1.0.0
为 OpenClaw 的 Markdown 记忆文件添加由向量驱动的语义搜索功能,实现按含义而非关键词即时查找过往记忆,大幅提升 Agent 的回忆能力和对话质量。