Agent + Skill 协同增强指南
本指南用于在 research-skills 中系统增强某一能力(不仅限代码),并保持跨模型一致性。
1) 先定目标:增强哪一类能力
先绑定到标准任务 ID(A1~I8):
- 选题与定位:
A1~A4 - 文献与综述:
B1~B5 - 研究设计/伦理:
C1~D2 - 证据综合:
E1~E5 - 写作:
F1~F6 - 合规与校对:
G1~J4(含去AI化改写) - 投稿与返修:
H1~H4 - 代码与复现:
I1~I8(包含 CCG 强约束代码引擎)
只要确定目标任务,就能复用统一编排链:plan -> mcp-evidence -> primary-agent-draft -> review-agent-check -> validator-gate。
2) 协同分工原则(固定)
- Skill:方法与产物标准(做什么、产出什么)。
- MCP:证据与工具层(从哪里取证、怎么落盘)。
- Agent:推理与写作执行层(如何完成草稿与复核)。
建议始终保留“双 agent”结构:主执行 + 独立复核。
3) 如何增强某个能力(标准流程)
- 选定目标任务(例如
E3或I2)。 - 在
standards/mcp-agent-capability-map.yaml中更新:required_mcprequired_skillsrequired_skill_cards(由skill_catalog自动解析)primary_agent/review_agent/fallback_agent
- 若新增 skill:
- 新建
skills/<A-I_stage>/<skill-name>.md - 加入
skill_registry、skill_catalog与task_skill_mapping
- 新建
- 若新增 agent runtime:
- 在
bridges/增加 bridge - 在
bridges/orchestrator.py的 runtime 路由中接入 - 参考现有实现:
bridges/claude_bridge.py
- 在
- 运行校验:
python3 scripts/validate_research_standard.py --strict
3.1) 外部 MCP 接入约定(命令模式)
对 filesystem 以外的 MCP,task-run 使用环境变量注入外部命令:
- 变量命名:
RESEARCH_MCP_<PROVIDER>_CMD - 例子:
RESEARCH_MCP_SCHOLARLY_SEARCH_CMD
执行约定:
- 编排器向命令
stdin传入 JSON:providertask_packet
- 外部命令从
stdout返回 JSON:status:ok|warning|error|not_configuredsummary: 简要结果provenance: 来源列表(可选)data: 结构化附加信息(可选)
未配置变量时,状态为 not_configured;可用 task-run --mcp-strict 强制阻断执行。
3.2) Skills 注入约定(标准化 skill cards)
task-run 会从 skill_catalog 自动注入 required_skill_cards,每张 card 至少包含:
skill:技能名category:技能类别(如evidence-synthesis、research-code)focus:执行重点file:技能规范路径(skills/*/*.md)default_outputs:建议产物路径
可用 task-run --skills-strict 在技能规范文件缺失时阻断执行。
3.3) Profile 注入约定(人格 / 审稿风格 / 工具权限)
避免全局固定配置,使用“按运行注入”的 profile 机制:
- profile 文件:
standards/agent-profiles.example.json - 并发模式:
parallel --profile-file ... --profile ... --summarizer-profile ...
- 任务模式:
task-run --profile-file ... --profile ...task-run --draft-profile ... --review-profile ... --triad-profile ...
优先级(高 -> 低):
- 命令行显式传参(如
--review-profile strict-review) task_overrides(按 Task ID 覆盖)--profile(本次运行默认 profile)- 内置
defaultprofile
profile 可定义:
personaanalysis_style/draft_style/review_style/summary_style/triad_styleruntime_options(按 agent 注入工具权限,如 Codex sandbox、Claude permission mode、Gemini sandbox)- 推荐设置:
non_interactive: true、timeout_seconds - 可选严格认证:
require_api_key: true(缺失 key 时直接快速失败,避免卡在登录流程)
- 推荐设置:
4) 按能力类型给出推荐协同模板
A. 代码能力(I1~I8)
- CCG 强约束执行 (I5-I8):借鉴
ccg-workflow,将代码阶段严格拆分为约束集提取(I5)->无决策规划(I6)->主端执行(I7)->侧端验收(I8)。 - 推荐 skills:
code-specification,code-planning,code-execution,code-review - 推荐 MCP:
code-runtime,filesystem - agent 组合:主执行
codex(执行I7),复核gemini(验收I8)
B. 系统综述能力(B1)
- 推荐 skills:
academic-searcher,paper-screener,paper-extractor,prisma-checker,evidence-synthesizer - 推荐 MCP:
scholarly-search,screening-tracker,extraction-store,fulltext-retrieval - agent 组合:主执行
claude,复核codex
C. 证据综合与 Meta(E1/E2/E3)
- 推荐 skills:
evidence-synthesizer,quality-assessor,code-builder - 推荐 MCP:
stats-engine,extraction-store - agent 组合:主执行
codex,复核claude
D. 写作与一致性(F3/G3)
- 推荐 skills:
manuscript-architect,citation-formatter,reporting-checker,quality-assessor - 推荐 MCP:
metadata-registry,reporting-guidelines - agent 组合:主执行
claude,复核codex
E. 去痕与终审校对(J1~J4)
- 多 AI 协作迭代:使用
--triad模式进行循环去 AI 化。主执行负责重写,复核负责检查 AI 痕迹,三端负责查验科学准确性。 - 推荐 skills:
proofread-editor,ai-detector,similarity-checker - agent 组合:主执行
claude,复核gemini,三端codex(通过task-run --triad)
F. 投稿与返修(H1~H4)
- 多角色专家互审 (H3-H4):在正式投稿前,通过平行调用模拟 Methodologist、Domain Expert 等苛刻审稿人进行交叉审查(H3),并执行 Desktop-reject 致命缺陷排查(H4)。
- 推荐 skills:
submission-packager,rebuttal-assistant,peer-review-simulation,fatal-flaw-detector - 推荐 MCP:
submission-kit,metadata-registry,reporting-guidelines - agent 组合:主执行
claude,复核gemini/codex
5) 运行入口(统一)
建议先做预检:
bash
python -m bridges.orchestrator doctor --cwd ./project使用 task-run 按任务执行并自动注入 required_skills + required_skill_cards:
bash
python -m bridges.orchestrator task-run \
--task-id F3 \
--paper-type empirical \
--topic ai-in-education \
--cwd ./project \
--context "Target venue style and strict claim-evidence alignment" \
--mcp-strict \
--skills-strict \
--triad--triad 会在主执行 + 复核之后,自动调用第三个 runtime agent 做独立审查,从而在 A~H 非代码阶段也保持三端协同。
并发分析模式(不限定 Task ID):
bash
python -m bridges.orchestrator parallel \
--prompt "审查当前研究方案的风险、证据缺口与改进顺序" \
--cwd ./project \
--summarizer claude该模式默认三端并发(Codex/Claude/Gemini),并在并发后执行总结分析;若三端不可用,会自动降级为双端或单端。
6) 引入外部 agent 还是自建 agent?
推荐混合策略:
- 外部 agent/runtime:负责通用能力上限(代码、推理、长文本)。
- 本地映射与约束:负责研究场景一致性与可控性(Task ID、质量门、产物路径、技能约束)。
也就是:把“能力”交给外部,把“标准”留在本地。