<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Agent Skills on 鬼哥的空间</title><link>https://luoli523.github.io/tags/agent-skills/</link><description>Recent content in Agent Skills on 鬼哥的空间</description><generator>Hugo -- gohugo.io</generator><language>zh-cn</language><lastBuildDate>Mon, 27 Apr 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://luoli523.github.io/tags/agent-skills/index.xml" rel="self" type="application/rss+xml"/><item><title>harness 不再纸上谈兵：开源 harness-project-template，附完整工作流实战</title><link>https://luoli523.github.io/p/harness-template-launch/</link><pubDate>Mon, 27 Apr 2026 00:00:00 +0000</pubDate><guid>https://luoli523.github.io/p/harness-template-launch/</guid><description>&lt;img src="https://luoli523.github.io/" alt="Featured image of post harness 不再纸上谈兵：开源 harness-project-template，附完整工作流实战" /&gt;
 &lt;blockquote&gt;
 &lt;p&gt;模型已经够强了。&lt;strong&gt;接下来卡你的不是模型，是工作流。&lt;/strong&gt;&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;Codex-5.5、Claude Opus 4.7、Gemini 3、Grok 4 这一代模型出来之后，&amp;ldquo;AI 写代码&amp;quot;的天花板被肉眼可见地抬高了一格。一句模糊的需求扔进去，500 行能跑的代码就出来了。&lt;/p&gt;
&lt;p&gt;但稍微跑过几个真项目你就会发现：模型再强，也只能解决&amp;quot;写代码&amp;quot;这一段；从需求到上线之间的所有事情——怎么拆需求、怎么管上下文、怎么验证、什么时候让人接管——需要一套系统化的运行规范。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;这就是 harness 要解决的问题。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;最近半年，&lt;a class="link" href="https://luoli523.github.io/p/harness-engineering/" target="_blank" rel="noopener"
 &gt;Anthropic、OpenAI、Google DeepMind、Stripe 一波接一波地讲 Harness Engineering&lt;/a&gt;；&lt;a class="link" href="https://luoli523.github.io/p/agent-skills-analysis/" target="_blank" rel="noopener"
 &gt;Addy Osmani 把 Google 14 年工程文化压缩成 19 个 agent skill 开源放出来&lt;/a&gt;；社区里&amp;quot;工作流第一、模型第二&amp;quot;几乎成了共识。&lt;strong&gt;理论分析和最佳实践讨论已经够多了。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;但你打开 GitHub 想找一个能 clone 就用的脚手架，会发现极少。要么是 SaaS 公司的工作流截图（看不到代码），要么是某个 README 里散落的 &lt;code&gt;CLAUDE.md&lt;/code&gt;（缺工具链衔接），要么是单个 skill 文件（没串成完整流水线）。&lt;strong&gt;理论已经足够，缺的是开箱即用的脚手架。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;于是鬼哥我做了两件事：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;整理出一个 GitHub Template：&lt;a class="link" href="https://github.com/luoli523/harness-project-template" target="_blank" rel="noopener"
 &gt;&lt;strong&gt;&lt;code&gt;luoli523/harness-project-template&lt;/code&gt;&lt;/strong&gt;&lt;/a&gt; —— Python + FastAPI 起步，clone 即用，30 秒装好。&lt;/li&gt;
&lt;li&gt;用它从 0 跑了一个真实 v1 示例项目（多币种财务账本），&lt;strong&gt;39 个 atomic commit、253 个测试、93.79% 覆盖&lt;/strong&gt;，从 SPEC 到 SHIP 一步没跳。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;下面分两部分：先看模板长什么样、怎么用；再看那个 v1 项目是怎么从一句需求一步一步落到 39 个 commit 的，全程截图。&lt;/p&gt;
&lt;p&gt;&lt;img alt="封面" class="gallery-image" data-flex-basis="360px" data-flex-grow="150" height="1024" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/harness-template-launch/cover.webp" srcset="https://luoli523.github.io/p/harness-template-launch/cover_hu_292a04e4679d26c1.webp 800w, https://luoli523.github.io/p/harness-template-launch/cover.webp 1536w" width="1536"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="一template长什么样怎么用"&gt;一、template：长什么样、怎么用
&lt;/h2&gt;&lt;h3 id="目录结构"&gt;目录结构
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt; 1
&lt;/span&gt;&lt;span class="lnt"&gt; 2
&lt;/span&gt;&lt;span class="lnt"&gt; 3
&lt;/span&gt;&lt;span class="lnt"&gt; 4
&lt;/span&gt;&lt;span class="lnt"&gt; 5
&lt;/span&gt;&lt;span class="lnt"&gt; 6
&lt;/span&gt;&lt;span class="lnt"&gt; 7
&lt;/span&gt;&lt;span class="lnt"&gt; 8
&lt;/span&gt;&lt;span class="lnt"&gt; 9
&lt;/span&gt;&lt;span class="lnt"&gt;10
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;harness-project-template/
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;├── .agent/prompts/ # 工具无关的 prompt 模板
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;├── .agents/skills/ # 6 个核心 skill（Claude Code + Codex 自动发现）
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;├── .claude/ # Claude Code 专属：slash commands + permissions
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;├── .github/workflows/ # CI 跑同一组门禁（ruff + mypy + pytest）
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;├── AGENTS.md # 项目规约（所有 agent 必读）
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;├── CLAUDE.md # 指向 AGENTS.md
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;├── src/&amp;lt;your_pkg&amp;gt;/ # FastAPI 脚手架（一个 /health 端点 + async 测试）
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;├── tests/
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;└── scripts/init-template.sh # 一键改名 + sync + 装 hooks
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;事实来源在 &lt;code&gt;AGENTS.md&lt;/code&gt; + &lt;code&gt;.agents/skills/&lt;/code&gt;，工具特定入口（slash command）只是包装。&lt;strong&gt;换 IDE 不用重新教 agent&lt;/strong&gt;，这是设计上的关键。&lt;/p&gt;
&lt;h3 id="6-个核心-skill"&gt;6 个核心 skill
&lt;/h3&gt;&lt;p&gt;这 6 个 skill 不是我自己造的——它们摘选自 Google 资深工程师 &lt;a class="link" href="https://addyosmani.com/" target="_blank" rel="noopener"
 &gt;Addy Osmani&lt;/a&gt; 开源的 &lt;a class="link" href="https://github.com/addyosmani/agent-skills" target="_blank" rel="noopener"
 &gt;&lt;strong&gt;&lt;code&gt;addyosmani/agent-skills&lt;/code&gt;&lt;/strong&gt;&lt;/a&gt; 项目（详细解读见 &lt;a class="link" href="https://luoli523.github.io/p/agent-skills-analysis/" target="_blank" rel="noopener"
 &gt;Agent Skills：当 Google 工程文化遇上 AI 编程代理&lt;/a&gt;）。Addy 把 Google 14 年工程文化压缩成 19 个 agent-executable skill，每个都是一份带&amp;quot;反合理化表&amp;quot;的 markdown 工作流。我没把 19 个全塞进模板，只放每个项目里&lt;strong&gt;最小化能把项目跑起来&lt;/strong&gt;的 6 个：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;Skill&lt;/th&gt;
 &lt;th&gt;何时调用&lt;/th&gt;
 &lt;th&gt;核心约束&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;spec-driven-development&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;新功能起步&lt;/td&gt;
 &lt;td&gt;先列假设清单 → 用户确认 → 写 spec&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;planning-and-task-breakdown&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;spec 通过后&lt;/td&gt;
 &lt;td&gt;拆成 ≤100 LOC 任务，每任务 2-5 条二元验收&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;incremental-implementation&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;单任务实现&lt;/td&gt;
 &lt;td&gt;RED → GREEN → REFACTOR → atomic commit&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;test-driven-development&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;任何业务逻辑&lt;/td&gt;
 &lt;td&gt;先写失败测试，看红，再写实现&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;code-review-and-quality&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;自审时&lt;/td&gt;
 &lt;td&gt;五轴顺序：correctness → readability → architecture → security → performance&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;code&gt;git-workflow-and-versioning&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;提交时&lt;/td&gt;
 &lt;td&gt;一任务一 commit，message 引用 spec&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;剩下 13 个（staged rollout、deprecation migration、incident response 等）按需加，不在最小集合里。&lt;/p&gt;
&lt;h3 id="三步起步"&gt;三步起步
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;span class="lnt"&gt;6
&lt;/span&gt;&lt;span class="lnt"&gt;7
&lt;/span&gt;&lt;span class="lnt"&gt;8
&lt;/span&gt;&lt;span class="lnt"&gt;9
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 1. 拉模板（GitHub UI 用 &amp;#34;Use this template&amp;#34; 也行）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;gh repo create my-service --template luoli523/harness-project-template --private --clone
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="nb"&gt;cd&lt;/span&gt; my-service
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 2. 一键改名 + sync + 装 hooks + 跑门禁&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;./scripts/init-template.sh my_service
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;&lt;span class="c1"&gt;# 3. 启动开发服务器，验证脚手架已绿&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;uv run uvicorn my_service.main:app --reload
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h3 id="标准使用顺序"&gt;标准使用顺序
&lt;/h3&gt;&lt;p&gt;之后任何新功能都走这个流程：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;div class="chroma"&gt;
&lt;table class="lntable"&gt;&lt;tr&gt;&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code&gt;&lt;span class="lnt"&gt;1
&lt;/span&gt;&lt;span class="lnt"&gt;2
&lt;/span&gt;&lt;span class="lnt"&gt;3
&lt;/span&gt;&lt;span class="lnt"&gt;4
&lt;/span&gt;&lt;span class="lnt"&gt;5
&lt;/span&gt;&lt;span class="lnt"&gt;6
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class="lntd"&gt;
&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-fallback" data-lang="fallback"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/spec &amp;lt;feature&amp;gt; # → 假设清单 → 你确认 → spec/&amp;lt;feature&amp;gt;.md
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/plan spec/&amp;lt;feature&amp;gt;.md # → 拆成 ≤100 LOC 任务清单
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/build spec/&amp;lt;feature&amp;gt;.md T1 # 一次一个任务，TDD + atomic commit
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/build spec/&amp;lt;feature&amp;gt;.md T2
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;... (重复直到 T_n)
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/review # 五轴自审，找 bug 修 bug
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;每个 slash command 包装一个 skill，跨工具一致。换到 Codex CLI 用 &lt;code&gt;$spec-driven-development&lt;/code&gt;、换到 Cursor 直接打开 &lt;code&gt;.agents/skills/&amp;lt;name&amp;gt;/SKILL.md&lt;/code&gt; 让 agent 跟着读。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="二实战从一句需求到-39-个-commit"&gt;二、实战：从一句需求到 39 个 commit
&lt;/h2&gt;&lt;p&gt;&lt;img alt="鬼哥的 spec → ship 工作流脚手架" class="gallery-image" data-flex-basis="430px" data-flex-grow="179" height="1536" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/harness-template-launch/guige_cover.webp" srcset="https://luoli523.github.io/p/harness-template-launch/guige_cover_hu_dc556e6821efdea9.webp 800w, https://luoli523.github.io/p/harness-template-launch/guige_cover_hu_5fc047761f6dfcac.webp 1600w, https://luoli523.github.io/p/harness-template-launch/guige_cover_hu_b501211a6c336cdc.webp 2400w, https://luoli523.github.io/p/harness-template-launch/guige_cover.webp 2752w" width="2752"&gt;&lt;/p&gt;
&lt;p&gt;光看模板不够说服力。下面是我用它跑一个真实 v1（多币种财务账本）的完整过程，截图为证。&lt;/p&gt;
&lt;h3 id="step-1-spec--一句话需求--假设清单"&gt;Step 1: &lt;code&gt;/spec&lt;/code&gt; —— 一句话需求 → 假设清单
&lt;/h3&gt;&lt;p&gt;我扔进去的需求是这样：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;我想做一个财务记账系统，自动按月生成资产负债表、利润表、现金流量表。日常货币是 SGD，CNY 消费、USD 投资、HKD 资产。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;注意 AI 没有立即开始写 spec。skill 强制它&lt;strong&gt;先列出所有它正打算做的隐含假设&lt;/strong&gt;，让我逐条确认：&lt;/p&gt;
&lt;p&gt;&lt;img alt="SPEC 阶段的假设清单" class="gallery-image" data-flex-basis="298px" data-flex-grow="124" height="857" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/harness-template-launch/step-2-assumptions.webp" srcset="https://luoli523.github.io/p/harness-template-launch/step-2-assumptions_hu_42b6b9862e7e6516.webp 800w, https://luoli523.github.io/p/harness-template-launch/step-2-assumptions.webp 1065w" width="1065"&gt;&lt;/p&gt;
&lt;p&gt;四大类：&lt;strong&gt;A. 范围切分（最关键，先确认）、B. 业务模型假设、C. 技术假设、D. 验收边界&lt;/strong&gt;。每条都是一个具体决定（&amp;ldquo;v1 不做权责发生制&amp;rdquo;、&amp;ldquo;HKD 折算并入而不单独成列&amp;rdquo;、&amp;ldquo;持久层用 SQLite&amp;rdquo;），等你 ✓。&lt;/p&gt;
&lt;p&gt;这一步的真实价值：&lt;strong&gt;它把需求里所有模糊的地方拽到表面&lt;/strong&gt;。你看到&amp;quot;v1 不做权责发生制&amp;quot;才会反应过来&amp;quot;等下，那利息预提怎么算？&amp;quot;——这才是真正要决定的事。&lt;/p&gt;
&lt;p&gt;我逐条回 OK 之后，AI 才动手写 &lt;code&gt;spec/&amp;lt;feature&amp;gt;.md&lt;/code&gt;。spec 写完，AI 主动停下：&lt;/p&gt;
&lt;p&gt;&lt;img alt="spec 写完后停在 plan 闸门前" class="gallery-image" data-flex-basis="1726px" data-flex-grow="719" height="135" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/harness-template-launch/step-3-spec-gate.webp" srcset="https://luoli523.github.io/p/harness-template-launch/step-3-spec-gate_hu_f36d8f4b6f5fb0f0.webp 800w, https://luoli523.github.io/p/harness-template-launch/step-3-spec-gate.webp 971w" width="971"&gt;&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&amp;ldquo;按规则停在这里，&lt;strong&gt;不进入 plan 阶段&lt;/strong&gt;。请做以下两件事之一：1. 签字通过——回 approved 或 /plan，或 2. 打回修改&amp;hellip;&amp;rdquo;&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;&lt;strong&gt;这就是 gated workflow 的实物体现&lt;/strong&gt;：闸门写在 skill 里，AI 自己执行。它不会越权，也不会替你决定 spec 通过没。&lt;/p&gt;
&lt;h3 id="step-2-plan--切成-27-个任务卡"&gt;Step 2: &lt;code&gt;/plan&lt;/code&gt; —— 切成 27 个任务卡
&lt;/h3&gt;&lt;p&gt;spec 签字之后，&lt;code&gt;/plan&lt;/code&gt; 命令把它拆成任务清单：&lt;/p&gt;
&lt;p&gt;&lt;img alt="plan 输出 27 个任务卡" class="gallery-image" data-flex-basis="338px" data-flex-grow="141" height="756" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/harness-template-launch/step-4-plan-output.webp" srcset="https://luoli523.github.io/p/harness-template-launch/step-4-plan-output_hu_9a75703b819bd9b0.webp 800w, https://luoli523.github.io/p/harness-template-launch/step-4-plan-output.webp 1067w" width="1067"&gt;&lt;/p&gt;
&lt;p&gt;每个任务：≤100 LOC 估算、2-5 条二元验收清单、列出 blocker、依赖图无环。底部 AI 还会标注它&lt;strong&gt;自己拿不准的拆分点&lt;/strong&gt;，建议我&amp;quot;扫一眼&amp;rdquo;——这种&amp;quot;主动暴露不确定性&amp;quot;也是 skill 引导出来的。&lt;/p&gt;
&lt;p&gt;最终这个项目切成 27 个任务，覆盖基础设施 → 数据模型 → 纯函数业务逻辑 → 仓储 → 报表引擎 → HTTP 路由 → 横切错误处理 → E2E + 收尾。&lt;/p&gt;
&lt;h3 id="step-3-build-t1-t2--t27--每任务一个-tdd-红绿循环"&gt;Step 3: &lt;code&gt;/build T1, T2, ... T27&lt;/code&gt; —— 每任务一个 TDD 红绿循环
&lt;/h3&gt;&lt;p&gt;&lt;code&gt;/build T1&lt;/code&gt; 开始第一个任务。RED 阶段——先写失败测试，跑红：&lt;/p&gt;
&lt;p&gt;&lt;img alt="测试跑红，开始装依赖、写实现" class="gallery-image" data-flex-basis="533px" data-flex-grow="222" height="388" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/harness-template-launch/step-6-tdd-red.webp" srcset="https://luoli523.github.io/p/harness-template-launch/step-6-tdd-red_hu_66a032b0a892c8a.webp 800w, https://luoli523.github.io/p/harness-template-launch/step-6-tdd-red.webp 863w" width="863"&gt;&lt;/p&gt;
&lt;p&gt;GREEN 阶段——装依赖、写实现、跑测试转绿、跑全门禁：&lt;/p&gt;
&lt;p&gt;&lt;img alt="全部测试通过 + 全门禁通过" class="gallery-image" data-flex-basis="705px" data-flex-grow="293" height="240" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/harness-template-launch/step-7-gates-pass.webp" width="705"&gt;&lt;/p&gt;
&lt;p&gt;&lt;code&gt;ruff check&lt;/code&gt; ✅、&lt;code&gt;ruff format --check&lt;/code&gt; ✅、&lt;code&gt;mypy --strict&lt;/code&gt; ✅、&lt;code&gt;pytest&lt;/code&gt; ✅ —— 四道门禁全过才算 GREEN。&lt;/p&gt;
&lt;p&gt;最后 atomic commit，pre-commit hooks 再过一遍，commit message 引用 spec + task ID：&lt;/p&gt;
&lt;p&gt;&lt;img alt="atomic commit" class="gallery-image" data-flex-basis="1118px" data-flex-grow="466" height="130" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/harness-template-launch/step-8-atomic-commit.webp" width="606"&gt;&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;关键&lt;/strong&gt;：单任务做完，AI 自动停下，等下一个 &lt;code&gt;/build T2&lt;/code&gt; 或 &lt;code&gt;approved&lt;/code&gt;：&lt;/p&gt;
&lt;p&gt;&lt;img alt="T1 完成后停下等下一个任务" class="gallery-image" data-flex-basis="1372px" data-flex-grow="571" height="121" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/harness-template-launch/step-9-stop-wait.webp" width="692"&gt;&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&amp;ldquo;T1 完成，停在这里。等你说 /build 或 approved 我再开 T2&amp;hellip;&amp;rdquo;&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;&lt;strong&gt;不会顺手做下一个任务&lt;/strong&gt;，不会&amp;quot;图省事一次写完几个&amp;quot;。每个任务一个独立 commit、独立的 RED→GREEN→commit 循环。这种粒度对未来 git bisect 找 bug、git revert 回滚都是无可替代的。&lt;/p&gt;
&lt;p&gt;T1 → T27 重复 27 次。&lt;/p&gt;
&lt;h3 id="step-4-review--五轴自审"&gt;Step 4: &lt;code&gt;/review&lt;/code&gt; —— 五轴自审
&lt;/h3&gt;&lt;p&gt;27 个任务全做完后，&lt;code&gt;/review&lt;/code&gt; 走五轴自审（correctness → readability → architecture → security → performance），找出了 5 个真 bug + 2 个 spec 漂移。每个发现拆成独立 fix commit + 测试，又是 7 个 commit。&lt;/p&gt;
&lt;h3 id="最终交付"&gt;最终交付
&lt;/h3&gt;&lt;p&gt;&lt;strong&gt;39 个 atomic commit、253 个测试、93.79% 覆盖&lt;/strong&gt;。&lt;code&gt;ruff + ruff format + mypy --strict + pytest&lt;/code&gt; 四道门禁全程绿。&lt;/p&gt;
&lt;p&gt;从一句需求到能跑的 v1，全程留痕、可审计、可回滚。每个设计抉择有 spec 锚点；每个 commit 可独立 revert；每个 bug 修复有测试。&lt;strong&gt;短期看慢一点，长期少欠一笔技术债。&lt;/strong&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="三takeaway现在去-clone"&gt;三、Takeaway：现在去 clone
&lt;/h2&gt;&lt;p&gt;理论文章已经读够多了。这一周我把工作流物化成模板 + 用它跑通一个真实项目，证明这套不是镜中水月。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;仓库地址&lt;/strong&gt;：&lt;a class="link" href="https://github.com/luoli523/harness-project-template" target="_blank" rel="noopener"
 &gt;&lt;strong&gt;&lt;code&gt;luoli523/harness-project-template&lt;/code&gt;&lt;/strong&gt;&lt;/a&gt; —— Python + FastAPI 起步，30 秒装好，欢迎试用。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;这套模板我会持续维护&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;你用它跑了项目、发现 skill 该改进、想加新 skill —— 提 issue 或 PR&lt;/li&gt;
&lt;li&gt;你跑出来的项目踩了模板没覆盖的坑 —— 提 issue，我把教训沉淀回模板&lt;/li&gt;
&lt;li&gt;你想要不同技术栈的类似脚手架（Go、Rust、TypeScript）—— 留言说明诉求，我考虑分仓维护&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;模型还会变强、context window 还会变大，但&lt;strong&gt;让模型按工作流出活&lt;/strong&gt;这个能力不会自动到来。希望这个仓库帮你省掉前两天的摸索成本。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="参考链接"&gt;参考链接
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;上篇 1：&lt;a class="link" href="https://luoli523.github.io/p/harness-engineering/" target="_blank" rel="noopener"
 &gt;Harness Engineering：当模型够强，系统设计成为胜负手&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;上篇 2：&lt;a class="link" href="https://luoli523.github.io/p/agent-skills-analysis/" target="_blank" rel="noopener"
 &gt;Agent Skills：当 Google 工程文化遇上 AI 编程代理&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;模板仓库：&lt;a class="link" href="https://github.com/luoli523/harness-project-template" target="_blank" rel="noopener"
 &gt;&lt;code&gt;luoli523/harness-project-template&lt;/code&gt;&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;原始 skills 项目：&lt;a class="link" href="https://github.com/addyosmani/agent-skills" target="_blank" rel="noopener"
 &gt;&lt;code&gt;addyosmani/agent-skills&lt;/code&gt;&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;</description></item></channel></rss>