Live Demo · V4 Protocol · Claude Code Contract · Codex Contract · MIT License
ResearchLoop V4 不是单个 Prompt,而是一套 AI Agent 协作治理工作流:
- Loop 1:方案脑暴 / 路线校验层 — GPT-Pro 负责问题定义、风险地图、证据基线、候选路线与修复;Claude 独立联网证伪并给出 BLOCKER/RISK/PASS;最终形成
010-040可交接 spec。 - Loop 2:协同交付 / 执行验证层 — Claude Code 读取
010-040,产出调研台账、draft plan、Test Oracle 与 PLAN AUDIT;Codex 只按 approved plan 执行、测试、复盘;Claude Code 终检后才进入 G3 候选。
打开:https://124-creator.github.io/ResearchLoop/
这是静态公开 Demo:不上传文本,不调用外部 API,不包含私有数据。所有交互都在浏览器本地完成。
010 问题定义、冻结与需求确认(G1 第一道)
→ 012 难题风险地图
→ 015 GPT-Pro 外部调研基线 + 证据分级 A/B/C/D
→ 020 GPT-Pro 中性候选路线 R1/R2/R3
→ 030 Claude 独立联网证伪评审 + BLOCKER 校准表
→ 035 新鲜上下文路线裁决(G1 第二道)
→ 040 三类验证桩:A 可行性 / B 反证 / C 集成
Loop 1 解决的问题:先判断怎么做才是对的。每一步都有文档交接物,不靠聊天记忆传递。
Claude Code 仓库探索 + 实现级联网调研 + skill 小测
→ INSTRUCTION LOAD CHECK
→ draft plan + Test Oracle + PLAN AUDIT
→ G2 人类 approved
→ WORKTREE CHECK
→ Codex 联网复核 + 隔离实现 + 测试
→ Codex 同号复盘
→ Claude Code 终检 + 联网反证搜索
→ G3 人类 verified
Loop 2 解决的问题:把已经选对的路线真正做对。Codex 不改范围、不换路线、不弱化测试;完成状态最多是 implemented,只有 G3 才是 verified。
- 动态双 Loop 控制台:点击每个节点,联动展示动作、交接物、证据 ID、下一步和回环理由。
- 010-040 严格映射:不再简化成“方案—审查—修复”,而是完整展示风险地图、证据分级、多路线、BLOCKER 校准、路线裁决和三类 Spike。
- 同号交付链:展示
research / plans / retrospectives / reviews如何通过NNN-模块中文名串起来,并用CC-R / CX-R / CC-V区分规划调研、执行证据与终检证据。 - 010 Packet Lab:把一句话任务转成 V4 第一层循环输入。
- GitHub Pages 友好:无构建、无外部脚本、单页静态可部署。
ResearchLoop/
├── index.html GitHub Pages 入口
├── apps/ Demo 源页面
├── assets/ 流程图和预览图
├── docs/v4/ V4 协议源文件(与本地更新指令保持一致)
├── examples/ 示例工作流产物
├── templates/ Plan 和复盘模板
├── AGENTS.md Codex 执行契约
├── CLAUDE.md Claude Code 审查契约
└── DESIGN.md Demo 设计源事实
公开仓库不应包含私有数据、凭据、个人联系方式、本地绝对路径或未公开项目材料。本 Demo 只展示工作流机制,不是后端执行服务。
- Current focus: V4 严格双 Loop 动态控制台。
- Deployment target: GitHub Pages。
- Verification style: local browser check, protocol keyword scan, mojibake scan, sensitive-info scan, screenshot preview。
MIT License.
