Blog

文章

技术探索 · AI实践 · 随想记录

共 22 篇

  1. 工具 4 min

    ai-convo-exporter:别让 AI 对话死在终端里

    Codex 和 Claude Code 每天都在帮你做决策、写代码、踩坑,但这些高价值对话常常散落在本机日志里。这个小工具把它们自动归档到 Obsidian,并按项目维度沉淀成可搜索的知识库。

    AI Obsidian Codex Claude Code 开发工具
  2. 随想 7 min

    一场三十年的资产负债表修复:读《以日为鉴》

    日本的三十年不是突然衰退,而是一场漫长的资产负债表修复:泡沫破裂后,债务、消费心理和人口结构一起改写了社会的默认行为。

    日本 以日为鉴 资产负债表衰退 低欲望社会 老龄化 消费
  3. AI 6 min

    一张 4090 跑 Gemma4 26B:用 Ollama 搭本地 AI 开发环境实测

    本地大模型已经不是玩具:这篇文章用 Ollama 部署 Gemma4 26B,接入 Codex、Claude Code 和 Hermes Agent,并给出 RTX 4090 上的真实推理数据。

    Ollama Gemma4 本地大模型 RTX 4090 AI Agent
  4. AI 7 min

    兴趣太多不是缺点:AI 时代,通才要把自己做成一个系统

    如果你一直觉得自己兴趣太多、无法定位,问题可能不是你不够专注,而是你还没有把兴趣装进一个能持续产出的容器。AI 时代,真正稀缺的不是技能,而是你能把多个领域连接成系统的能力。

    AI 创作者经济 个人品牌 通才 Dan Koe
  5. AI 7 min

    harness 不再纸上谈兵:开源 harness-project-template,附完整工作流实战

    现在大家都在谈 harness engineering 和 agent-skills,理论文章铺天盖地,但能 clone 就用的开源模板很少。这篇放上鬼哥整理的 harness-project-template,附完整使用流程,再用一个真实 v1 项目(家庭多币种账本,39 commit、253 测试、93.79% 覆盖)走一遍全程,截图为证。

    Harness Engineering Agent Skills Claude Code 工程实践 模板
  6. AI 6 min

    Whisper Large V3 Turbo 上手指南:让你的电脑听懂 99 种语言

    99 种语言、本地离线、5 分钟转录 1 小时音频,OpenAI 把语音识别做成了水电煤。这篇手把手教你在自己的电脑上跑起来 Whisper Turbo,附场景对比表、付费云服务横评和两个零废话的实操路径。

    Whisper 语音识别 faster-whisper 开源模型 实操指南
  7. AI 3 min

    后端上下文工程:一个开源工具把 Claude Code 的账单砍掉 2/3

    同样一个 RAG 应用,Supabase 花了 10.4M token、$9.21;InsForge 只花了 3.7M、$2.81。差距不在模型,而在后端怎么把状态喂给 Agent。这篇文章拆解 Karpathy 的上下文工程原则,在后端落地时到底意味着什么。

    Claude Code Context Engineering MCP Token Agent
  8. AI 18 min

    Claude-Cookbooks 全景导航:被 README 藏起来的另一半

    4 万 star 的 anthropics/claude-cookbooks,README 里只告诉了你十几条链接——实际仓库里塞着接近一百篇 notebook。这篇文章把它按主题重新整理成一张可以反复查的索引地图,覆盖 API 基础能力、Tool Use、Agent SDK、Managed Agents、Skills 和一堆你可能没听过的进阶模块。

    Claude Anthropic Cookbook Agent LLM
  9. AI 7 min

    Prompt Caching 深度拆解:Claude Code 是如何做到 92% 命中率的

    每一次 Agent 对话都要把 system prompt、tool schema、项目上下文重新喂给模型一遍——这是长会话里最贵的一笔冗余。Prompt Caching 不是一个可以「打开」的开关,而是一种必须贯穿到架构层面的纪律。这篇文章拆解 KV Cache 的工作原理、经济账,以及 Claude Code 是如何把缓存命中率做到 92%、把成本打掉 81% 的。

    LLM Prompt Caching Claude Code KV Cache Agent 架构
  10. AI 7 min

    Claude Code Session 管理指南:1M 上下文是把双刃剑

    100 万 token 的上下文窗口让 Claude Code 能跑更长的任务,但不懂管理 Session,它反而会拖垮你。这篇文章来自 Anthropic 内部与重度用户的访谈总结,讲清楚了 Context Rot、/rewind、/compact、Subagent 这些关键操作背后的逻辑。

    Claude Code LLM 工具技巧 Context Window
  11. AI 7 min

    DESIGN.md:让 AI 拥有"设计品味"的新标准

    一个 markdown 文件,51,000 颗 star。Google Stitch 发明的 DESIGN.md 概念,正在成为 AI Coding Agent 时代的设计系统新标准——本文带你完整理解它是什么、为什么有效,以及如何立刻用在你的项目里。

    AI UI设计 Design System Claude Code 前端
  12. AI 12 min

    150 行代码,给你的博客装一个 AI 数字分身

    手把手教你用 Node.js + Vercel + OpenAI API 搭建一个最简单的 AI 聊天机器人,完整代码开源,从人设设计到部署上线一篇搞定。

    AI ChatBot Vercel OpenAI 实战教程
  13. AI 12 min

    Claude Managed Agents:从聊天机器人到自主 Agent 的一步之遥

    Anthropic 推出 Managed Agents——托管式 Agent 运行时。本文以鬼哥的数字分身为案例,对比手搓版聊天机器人与 Managed Agents 托管版的差异,深入解析这个 'Claude Code as a Service' 的全部能力。

    Claude AI Agent Managed Agents Anthropic 架构设计
  14. AI 16 min

    Agent Skills:当 Google 工程文化遇上 AI 编程代理

    深度解析 Addy Osmani 的 agent-skills 项目——如何将 Google 14 年工程纪律编码为 19 个 AI Agent 可执行的 skill,以及为什么「反合理化」是对抗 AI 走捷径的最重要设计模式。

    AI Agent Claude Code 工程实践 Addy Osmani 编程效率
  15. AI 15 min

    Karpathy 的 LLM Wiki:用大模型编译知识,而不是检索知识

    深度解析 Karpathy 提出的 LLM 知识库模式:从 1945 年 Memex 的构想到 2026 年的实现,从 RAG 的局限到知识编译的范式转换,以及如何从零构建你自己的 LLM Wiki。

    LLM 知识管理 Karpathy Obsidian RAG
  16. AI 9 min

    Gemma 4 深度解析:从「不可用」到「生产级」的 Agent 质变

    Google 最新开源模型 Gemma 4 的架构革新、性能跃迁与五个有趣的实战应用场景。tau2-bench 从 6.6% 到 86.4%,单代提升 13 倍,开源 Agent 终于进入生产时代。

    Gemma Google 开源模型 Agent 边缘AI
  17. AI 11 min

    解剖 Claude Code(三):Prompt 缓存分割与四级上下文压缩

    一次 Sonnet API 调用,输入 Token 价格 $3/百万,命中 Prompt Cache 降到 $0.30/百万。Claude Code 为此设计了精密的缓存分割和四级压缩体系,让长对话不至于'烧钱到心疼'。

    Claude Code Agent 源码分析
  18. AI 12 min

    解剖 Claude Code(二):ReAct 循环 — while(true) 里的五个阶段与七层恢复

    Claude Code 的心脏是 query.ts 中一个 1,700 行的 while(true) 循环,实现了经典的 ReAct 模式。五个阶段逐层递进,七层恢复机制让系统在各种异常下自我修复。

    Claude Code Agent 源码分析
  19. AI 13 min

    解剖 Claude Code(一):512K 行代码,一个终端里的 Agent Runtime

    Anthropic Claude Code CLI 完整源码泄露,512K 行 TypeScript 揭示了一个完整的 AI Agent 运行时架构:Bun 运行时、React+Ink 终端渲染、ReAct 主循环、七层错误恢复、五层记忆体系、投机执行与多 Agent 编排。

    Claude Code Agent 源码分析
  20. AI 18 min

    Harness Engineering:当模型够强,系统设计成为胜负手

    从 Prompt Engineering 到 Context Engineering 再到 Harness Engineering,梳理 AI Agent 工程化的三次范式跃迁,拆解头部公司的实践方案,并给出务实的行动路径。

    Agent Harness Engineering
  21. AI 10 min

    深入解析 .claude/ 文件夹:完整指南

    全面解析 Claude Code 的 .claude/ 文件夹结构,包括 CLAUDE.md、自定义命令、Skills、Agents 和权限配置。

    Claude Code
  22. 随想 1 min

    新站上线:用 Hugo + Stack 重建个人博客

    旧站清空重建,新的开始。

    博客 Hugo