Blog

文章

技术探索 · AI实践 · 随想记录

共 31 篇

2026-06-22 AI 9 min
OKF：AI Agent 缺的不是模型，是可交接的上下文
Google Cloud 发布 Open Knowledge Format，看似只是 Markdown + YAML，真正想解决的是企业 AI Agent 最麻烦的问题：知识散落、上下文不可迁移、每个团队都在重复造轮子。
AI Agent Context Engineering OKF 知识管理
2026-06-18 AI 8 min
你是什么，你的 AI 就是什么
人人都有 AI 之后，差距不会消失，反而会被放大。真正稀缺的不是工具，而是人的问题意识、判断力、审美和经历。
AI时代认知职业成长创造力
2026-06-17 AI 7 min
Loop Engineering：Agent 不是跑一次，而是活在循环里
LangChain 把 Agent 工程拆成四层循环：执行、验证、事件驱动、爬坡优化。真正的可靠性，不在 prompt 里，而在循环结构里。
AI Agent Loop Engineering LangChain LangGraph Agent 工程
2026-06-17 AI 7 min
别再只会提示词了：下一代程序员要会设计 Agent 循环
Addy Osmani 说，未来不是你不断提示 coding agent，而是设计一套会自己提示、执行、验证和记忆的循环系统。听起来像自动驾驶，真正危险的地方也在这里。
AI Agent Loop Engineering Codex Claude Code Agent 工程
2026-06-15 AI 15 min
桌面 AI Studio 怎么选：DGX Spark、Ryzen AI Halo 和 M4 Max Mac Studio
本地 AI 工作站不该只看 TOPS。DGX Spark、Ryzen AI Halo 和 M4 Max Mac Studio 代表三条完全不同的桌面 AI 路线：CUDA、ROCm 和 Apple Silicon。
本地大模型 AI工作站 NVIDIA AMD Apple Silicon
2026-06-10 AI 7 min
别再调教模型了：聪明人都在设计循环
Anthropic 的 Lance Martin 说：与其费劲 prompt 和 steer 模型，不如设计好让它自我纠正的循环。在一个 ML 工程挑战上，这种思路让新模型把训练 pipeline 优化了 6 倍于上一代。
Claude AI Agent 自我纠正记忆 Agent 工程
2026-06-06 AI 12 min
从 install.sh 到 Plugin —— guige-skills 的进化史
13 个 skill、3 套平台、1 个 hook —— 没有 plugin 之前我用 80 行 bash + symlink 撑着，用了 plugin 之后只剩一行 /plugin install。这是一份从 symlink 撑场子，到三套 manifest 同步、CI 校验、hook 注册全套打通的迁移记录。
Claude Code Plugin Skill Marketplace
2026-05-28 AI 40 min
agent-skills 项目手册：六层架构的极致颗粒度参考
agent-skills 项目的完整内部技术参考手册。逐层覆盖 CLAUDE.md、using-agent-skills、commands、agents、skills、references、hooks，包含完整文件清单、关键代码片段、跨文件引用关系、设计取舍、注意事项与可复用模板。
AI Agent Claude Code 架构设计 agent-skills 参考手册
2026-05-28 AI 27 min
从使用者到学习者：agent-skills 架构深度剖析与高手思维体系
用了一段时间 agent-skills 后，鬼哥决定深入到项目源码里去读。这篇笔记把六层架构 + 横切 hooks 一层层拆开，讲清楚为什么工程纪律对 AI 项目质量影响巨大，以及为什么这套体系背后的思维比架构本身更值得学。
AI Agent Claude Code 架构设计 agent-skills 工程实践
2026-05-08 工具 4 min
ai-convo-exporter：别让 AI 对话死在终端里
Codex 和 Claude Code 每天都在帮你做决策、写代码、踩坑，但这些高价值对话常常散落在本机日志里。这个小工具把它们自动归档到 Obsidian，并按项目维度沉淀成可搜索的知识库。
AI Obsidian Codex Claude Code 开发工具
2026-05-07 随想 7 min
一场三十年的资产负债表修复：读《以日为鉴》
日本的三十年不是突然衰退，而是一场漫长的资产负债表修复：泡沫破裂后，债务、消费心理和人口结构一起改写了社会的默认行为。
日本以日为鉴资产负债表衰退低欲望社会老龄化消费
2026-05-04 AI 6 min
一张 4090 跑 Gemma4 26B：用 Ollama 搭本地 AI 开发环境实测
本地大模型已经不是玩具：这篇文章用 Ollama 部署 Gemma4 26B，接入 Codex、Claude Code 和 Hermes Agent，并给出 RTX 4090 上的真实推理数据。
Ollama Gemma4 本地大模型 RTX 4090 AI Agent
2026-04-28 AI 7 min
兴趣太多不是缺点：AI 时代，通才要把自己做成一个系统
如果你一直觉得自己兴趣太多、无法定位，问题可能不是你不够专注，而是你还没有把兴趣装进一个能持续产出的容器。AI 时代，真正稀缺的不是技能，而是你能把多个领域连接成系统的能力。
AI 创作者经济个人品牌通才 Dan Koe
2026-04-27 AI 7 min
harness 不再纸上谈兵：开源 harness-project-template，附完整工作流实战
现在大家都在谈 harness engineering 和 agent-skills，理论文章铺天盖地，但能 clone 就用的开源模板很少。这篇放上鬼哥整理的 harness-project-template，附完整使用流程，再用一个真实 v1 项目（家庭多币种账本，39 commit、253 测试、93.79% 覆盖）走一遍全程，截图为证。
Harness Engineering Agent Skills Claude Code 工程实践模板
2026-04-26 AI 6 min
Whisper Large V3 Turbo 上手指南：让你的电脑听懂 99 种语言
99 种语言、本地离线、5 分钟转录 1 小时音频，OpenAI 把语音识别做成了水电煤。这篇手把手教你在自己的电脑上跑起来 Whisper Turbo，附场景对比表、付费云服务横评和两个零废话的实操路径。
Whisper 语音识别 faster-whisper 开源模型实操指南
2026-04-22 AI 3 min
后端上下文工程：一个开源工具把 Claude Code 的账单砍掉 2/3
同样一个 RAG 应用，Supabase 花了 10.4M token、$9.21；InsForge 只花了 3.7M、$2.81。差距不在模型，而在后端怎么把状态喂给 Agent。这篇文章拆解 Karpathy 的上下文工程原则，在后端落地时到底意味着什么。
Claude Code Context Engineering MCP Token Agent
2026-04-18 AI 18 min
Claude-Cookbooks 全景导航：被 README 藏起来的另一半
4 万 star 的 anthropics/claude-cookbooks，README 里只告诉了你十几条链接——实际仓库里塞着接近一百篇 notebook。这篇文章把它按主题重新整理成一张可以反复查的索引地图，覆盖 API 基础能力、Tool Use、Agent SDK、Managed Agents、Skills 和一堆你可能没听过的进阶模块。
Claude Anthropic Cookbook Agent LLM
2026-04-17 AI 7 min
Prompt Caching 深度拆解：Claude Code 是如何做到 92% 命中率的
每一次 Agent 对话都要把 system prompt、tool schema、项目上下文重新喂给模型一遍——这是长会话里最贵的一笔冗余。Prompt Caching 不是一个可以「打开」的开关，而是一种必须贯穿到架构层面的纪律。这篇文章拆解 KV Cache 的工作原理、经济账，以及 Claude Code 是如何把缓存命中率做到 92%、把成本打掉 81% 的。
LLM Prompt Caching Claude Code KV Cache Agent 架构
2026-04-16 AI 7 min
Claude Code Session 管理指南：1M 上下文是把双刃剑
100 万 token 的上下文窗口让 Claude Code 能跑更长的任务，但不懂管理 Session，它反而会拖垮你。这篇文章来自 Anthropic 内部与重度用户的访谈总结，讲清楚了 Context Rot、/rewind、/compact、Subagent 这些关键操作背后的逻辑。
Claude Code LLM 工具技巧 Context Window
2026-04-12 AI 7 min
DESIGN.md：让 AI 拥有"设计品味"的新标准
一个 markdown 文件，51,000 颗 star。Google Stitch 发明的 DESIGN.md 概念，正在成为 AI Coding Agent 时代的设计系统新标准——本文带你完整理解它是什么、为什么有效，以及如何立刻用在你的项目里。
AI UI设计 Design System Claude Code 前端
2026-04-10 AI 12 min
150 行代码，给你的博客装一个 AI 数字分身
手把手教你用 Node.js + Vercel + OpenAI API 搭建一个最简单的 AI 聊天机器人，完整代码开源，从人设设计到部署上线一篇搞定。
AI ChatBot Vercel OpenAI 实战教程
2026-04-09 AI 12 min
Claude Managed Agents：从聊天机器人到自主 Agent 的一步之遥
Anthropic 推出 Managed Agents——托管式 Agent 运行时。本文以鬼哥的数字分身为案例，对比手搓版聊天机器人与 Managed Agents 托管版的差异，深入解析这个 'Claude Code as a Service' 的全部能力。
Claude AI Agent Managed Agents Anthropic 架构设计
2026-04-07 AI 16 min
Agent Skills：当 Google 工程文化遇上 AI 编程代理
深度解析 Addy Osmani 的 agent-skills 项目——如何将 Google 14 年工程纪律编码为 19 个 AI Agent 可执行的 skill，以及为什么「反合理化」是对抗 AI 走捷径的最重要设计模式。
AI Agent Claude Code 工程实践 Addy Osmani 编程效率
2026-04-06 AI 15 min
Karpathy 的 LLM Wiki：用大模型编译知识，而不是检索知识
深度解析 Karpathy 提出的 LLM 知识库模式：从 1945 年 Memex 的构想到 2026 年的实现，从 RAG 的局限到知识编译的范式转换，以及如何从零构建你自己的 LLM Wiki。
LLM 知识管理 Karpathy Obsidian RAG
2026-04-05 AI 9 min
Gemma 4 深度解析：从「不可用」到「生产级」的 Agent 质变
Google 最新开源模型 Gemma 4 的架构革新、性能跃迁与五个有趣的实战应用场景。tau2-bench 从 6.6% 到 86.4%，单代提升 13 倍，开源 Agent 终于进入生产时代。
Gemma Google 开源模型 Agent 边缘AI
2026-04-04 AI 11 min
解剖 Claude Code（三）：Prompt 缓存分割与四级上下文压缩
一次 Sonnet API 调用，输入 Token 价格 $3/百万，命中 Prompt Cache 降到 $0.30/百万。Claude Code 为此设计了精密的缓存分割和四级压缩体系，让长对话不至于'烧钱到心疼'。
Claude Code Agent 源码分析
2026-04-03 AI 12 min
解剖 Claude Code（二）：ReAct 循环 — while(true) 里的五个阶段与七层恢复
Claude Code 的心脏是 query.ts 中一个 1,700 行的 while(true) 循环，实现了经典的 ReAct 模式。五个阶段逐层递进，七层恢复机制让系统在各种异常下自我修复。
Claude Code Agent 源码分析
2026-04-02 AI 13 min
解剖 Claude Code（一）：512K 行代码，一个终端里的 Agent Runtime
Anthropic Claude Code CLI 完整源码泄露，512K 行 TypeScript 揭示了一个完整的 AI Agent 运行时架构：Bun 运行时、React+Ink 终端渲染、ReAct 主循环、七层错误恢复、五层记忆体系、投机执行与多 Agent 编排。
Claude Code Agent 源码分析
2026-04-01 AI 18 min
Harness Engineering：当模型够强，系统设计成为胜负手
从 Prompt Engineering 到 Context Engineering 再到 Harness Engineering，梳理 AI Agent 工程化的三次范式跃迁，拆解头部公司的实践方案，并给出务实的行动路径。
Agent Harness Engineering
2026-03-25 AI 10 min
深入解析 .claude/ 文件夹：完整指南
全面解析 Claude Code 的 .claude/ 文件夹结构，包括 CLAUDE.md、自定义命令、Skills、Agents 和权限配置。
Claude Code
2026-03-23 随想 1 min
新站上线：用 Hugo + Stack 重建个人博客
旧站清空重建，新的开始。
博客 Hugo

OKF：AI Agent 缺的不是模型，是可交接的上下文

你是什么，你的 AI 就是什么

Loop Engineering：Agent 不是跑一次，而是活在循环里

别再只会提示词了：下一代程序员要会设计 Agent 循环

桌面 AI Studio 怎么选：DGX Spark、Ryzen AI Halo 和 M4 Max Mac Studio

别再调教模型了：聪明人都在设计循环

从 install.sh 到 Plugin —— guige-skills 的进化史

agent-skills 项目手册：六层架构的极致颗粒度参考

从使用者到学习者：agent-skills 架构深度剖析与高手思维体系

ai-convo-exporter：别让 AI 对话死在终端里

一场三十年的资产负债表修复：读《以日为鉴》

一张 4090 跑 Gemma4 26B：用 Ollama 搭本地 AI 开发环境实测

兴趣太多不是缺点：AI 时代，通才要把自己做成一个系统

harness 不再纸上谈兵：开源 harness-project-template，附完整工作流实战

Whisper Large V3 Turbo 上手指南：让你的电脑听懂 99 种语言

后端上下文工程：一个开源工具把 Claude Code 的账单砍掉 2/3

Claude-Cookbooks 全景导航：被 README 藏起来的另一半

Prompt Caching 深度拆解：Claude Code 是如何做到 92% 命中率的

Claude Code Session 管理指南：1M 上下文是把双刃剑

DESIGN.md：让 AI 拥有"设计品味"的新标准

150 行代码，给你的博客装一个 AI 数字分身

Claude Managed Agents：从聊天机器人到自主 Agent 的一步之遥

Agent Skills：当 Google 工程文化遇上 AI 编程代理

Karpathy 的 LLM Wiki：用大模型编译知识，而不是检索知识

Gemma 4 深度解析：从「不可用」到「生产级」的 Agent 质变

解剖 Claude Code（三）：Prompt 缓存分割与四级上下文压缩

解剖 Claude Code（二）：ReAct 循环 — while(true) 里的五个阶段与七层恢复

解剖 Claude Code（一）：512K 行代码，一个终端里的 Agent Runtime

Harness Engineering：当模型够强，系统设计成为胜负手

深入解析 .claude/ 文件夹：完整指南

新站上线：用 Hugo + Stack 重建个人博客