技术探索 · AI实践 · 随想记录
共 22 篇
Codex 和 Claude Code 每天都在帮你做决策、写代码、踩坑,但这些高价值对话常常散落在本机日志里。这个小工具把它们自动归档到 Obsidian,并按项目维度沉淀成可搜索的知识库。
日本的三十年不是突然衰退,而是一场漫长的资产负债表修复:泡沫破裂后,债务、消费心理和人口结构一起改写了社会的默认行为。
本地大模型已经不是玩具:这篇文章用 Ollama 部署 Gemma4 26B,接入 Codex、Claude Code 和 Hermes Agent,并给出 RTX 4090 上的真实推理数据。
如果你一直觉得自己兴趣太多、无法定位,问题可能不是你不够专注,而是你还没有把兴趣装进一个能持续产出的容器。AI 时代,真正稀缺的不是技能,而是你能把多个领域连接成系统的能力。
现在大家都在谈 harness engineering 和 agent-skills,理论文章铺天盖地,但能 clone 就用的开源模板很少。这篇放上鬼哥整理的 harness-project-template,附完整使用流程,再用一个真实 v1 项目(家庭多币种账本,39 commit、253 测试、93.79% 覆盖)走一遍全程,截图为证。
99 种语言、本地离线、5 分钟转录 1 小时音频,OpenAI 把语音识别做成了水电煤。这篇手把手教你在自己的电脑上跑起来 Whisper Turbo,附场景对比表、付费云服务横评和两个零废话的实操路径。
同样一个 RAG 应用,Supabase 花了 10.4M token、$9.21;InsForge 只花了 3.7M、$2.81。差距不在模型,而在后端怎么把状态喂给 Agent。这篇文章拆解 Karpathy 的上下文工程原则,在后端落地时到底意味着什么。
4 万 star 的 anthropics/claude-cookbooks,README 里只告诉了你十几条链接——实际仓库里塞着接近一百篇 notebook。这篇文章把它按主题重新整理成一张可以反复查的索引地图,覆盖 API 基础能力、Tool Use、Agent SDK、Managed Agents、Skills 和一堆你可能没听过的进阶模块。
每一次 Agent 对话都要把 system prompt、tool schema、项目上下文重新喂给模型一遍——这是长会话里最贵的一笔冗余。Prompt Caching 不是一个可以「打开」的开关,而是一种必须贯穿到架构层面的纪律。这篇文章拆解 KV Cache 的工作原理、经济账,以及 Claude Code 是如何把缓存命中率做到 92%、把成本打掉 81% 的。
100 万 token 的上下文窗口让 Claude Code 能跑更长的任务,但不懂管理 Session,它反而会拖垮你。这篇文章来自 Anthropic 内部与重度用户的访谈总结,讲清楚了 Context Rot、/rewind、/compact、Subagent 这些关键操作背后的逻辑。
一个 markdown 文件,51,000 颗 star。Google Stitch 发明的 DESIGN.md 概念,正在成为 AI Coding Agent 时代的设计系统新标准——本文带你完整理解它是什么、为什么有效,以及如何立刻用在你的项目里。
手把手教你用 Node.js + Vercel + OpenAI API 搭建一个最简单的 AI 聊天机器人,完整代码开源,从人设设计到部署上线一篇搞定。
Anthropic 推出 Managed Agents——托管式 Agent 运行时。本文以鬼哥的数字分身为案例,对比手搓版聊天机器人与 Managed Agents 托管版的差异,深入解析这个 'Claude Code as a Service' 的全部能力。
深度解析 Addy Osmani 的 agent-skills 项目——如何将 Google 14 年工程纪律编码为 19 个 AI Agent 可执行的 skill,以及为什么「反合理化」是对抗 AI 走捷径的最重要设计模式。
深度解析 Karpathy 提出的 LLM 知识库模式:从 1945 年 Memex 的构想到 2026 年的实现,从 RAG 的局限到知识编译的范式转换,以及如何从零构建你自己的 LLM Wiki。
Google 最新开源模型 Gemma 4 的架构革新、性能跃迁与五个有趣的实战应用场景。tau2-bench 从 6.6% 到 86.4%,单代提升 13 倍,开源 Agent 终于进入生产时代。
一次 Sonnet API 调用,输入 Token 价格 $3/百万,命中 Prompt Cache 降到 $0.30/百万。Claude Code 为此设计了精密的缓存分割和四级压缩体系,让长对话不至于'烧钱到心疼'。
Claude Code 的心脏是 query.ts 中一个 1,700 行的 while(true) 循环,实现了经典的 ReAct 模式。五个阶段逐层递进,七层恢复机制让系统在各种异常下自我修复。
Anthropic Claude Code CLI 完整源码泄露,512K 行 TypeScript 揭示了一个完整的 AI Agent 运行时架构:Bun 运行时、React+Ink 终端渲染、ReAct 主循环、七层错误恢复、五层记忆体系、投机执行与多 Agent 编排。
从 Prompt Engineering 到 Context Engineering 再到 Harness Engineering,梳理 AI Agent 工程化的三次范式跃迁,拆解头部公司的实践方案,并给出务实的行动路径。
全面解析 Claude Code 的 .claude/ 文件夹结构,包括 CLAUDE.md、自定义命令、Skills、Agents 和权限配置。
旧站清空重建,新的开始。