技术探索 · AI实践 · 随想记录
共 31 篇
Google Cloud 发布 Open Knowledge Format,看似只是 Markdown + YAML,真正想解决的是企业 AI Agent 最麻烦的问题:知识散落、上下文不可迁移、每个团队都在重复造轮子。
人人都有 AI 之后,差距不会消失,反而会被放大。真正稀缺的不是工具,而是人的问题意识、判断力、审美和经历。
LangChain 把 Agent 工程拆成四层循环:执行、验证、事件驱动、爬坡优化。真正的可靠性,不在 prompt 里,而在循环结构里。
Addy Osmani 说,未来不是你不断提示 coding agent,而是设计一套会自己提示、执行、验证和记忆的循环系统。听起来像自动驾驶,真正危险的地方也在这里。
本地 AI 工作站不该只看 TOPS。DGX Spark、Ryzen AI Halo 和 M4 Max Mac Studio 代表三条完全不同的桌面 AI 路线:CUDA、ROCm 和 Apple Silicon。
Anthropic 的 Lance Martin 说:与其费劲 prompt 和 steer 模型,不如设计好让它自我纠正的循环。在一个 ML 工程挑战上,这种思路让新模型把训练 pipeline 优化了 6 倍于上一代。
13 个 skill、3 套平台、1 个 hook —— 没有 plugin 之前我用 80 行 bash + symlink 撑着,用了 plugin 之后只剩一行 /plugin install。这是一份从 symlink 撑场子,到三套 manifest 同步、CI 校验、hook 注册全套打通的迁移记录。
agent-skills 项目的完整内部技术参考手册。逐层覆盖 CLAUDE.md、using-agent-skills、commands、agents、skills、references、hooks,包含完整文件清单、关键代码片段、跨文件引用关系、设计取舍、注意事项与可复用模板。
用了一段时间 agent-skills 后,鬼哥决定深入到项目源码里去读。这篇笔记把六层架构 + 横切 hooks 一层层拆开,讲清楚为什么工程纪律对 AI 项目质量影响巨大,以及为什么这套体系背后的思维比架构本身更值得学。
Codex 和 Claude Code 每天都在帮你做决策、写代码、踩坑,但这些高价值对话常常散落在本机日志里。这个小工具把它们自动归档到 Obsidian,并按项目维度沉淀成可搜索的知识库。
日本的三十年不是突然衰退,而是一场漫长的资产负债表修复:泡沫破裂后,债务、消费心理和人口结构一起改写了社会的默认行为。
本地大模型已经不是玩具:这篇文章用 Ollama 部署 Gemma4 26B,接入 Codex、Claude Code 和 Hermes Agent,并给出 RTX 4090 上的真实推理数据。
如果你一直觉得自己兴趣太多、无法定位,问题可能不是你不够专注,而是你还没有把兴趣装进一个能持续产出的容器。AI 时代,真正稀缺的不是技能,而是你能把多个领域连接成系统的能力。
现在大家都在谈 harness engineering 和 agent-skills,理论文章铺天盖地,但能 clone 就用的开源模板很少。这篇放上鬼哥整理的 harness-project-template,附完整使用流程,再用一个真实 v1 项目(家庭多币种账本,39 commit、253 测试、93.79% 覆盖)走一遍全程,截图为证。
99 种语言、本地离线、5 分钟转录 1 小时音频,OpenAI 把语音识别做成了水电煤。这篇手把手教你在自己的电脑上跑起来 Whisper Turbo,附场景对比表、付费云服务横评和两个零废话的实操路径。
同样一个 RAG 应用,Supabase 花了 10.4M token、$9.21;InsForge 只花了 3.7M、$2.81。差距不在模型,而在后端怎么把状态喂给 Agent。这篇文章拆解 Karpathy 的上下文工程原则,在后端落地时到底意味着什么。
4 万 star 的 anthropics/claude-cookbooks,README 里只告诉了你十几条链接——实际仓库里塞着接近一百篇 notebook。这篇文章把它按主题重新整理成一张可以反复查的索引地图,覆盖 API 基础能力、Tool Use、Agent SDK、Managed Agents、Skills 和一堆你可能没听过的进阶模块。
每一次 Agent 对话都要把 system prompt、tool schema、项目上下文重新喂给模型一遍——这是长会话里最贵的一笔冗余。Prompt Caching 不是一个可以「打开」的开关,而是一种必须贯穿到架构层面的纪律。这篇文章拆解 KV Cache 的工作原理、经济账,以及 Claude Code 是如何把缓存命中率做到 92%、把成本打掉 81% 的。
100 万 token 的上下文窗口让 Claude Code 能跑更长的任务,但不懂管理 Session,它反而会拖垮你。这篇文章来自 Anthropic 内部与重度用户的访谈总结,讲清楚了 Context Rot、/rewind、/compact、Subagent 这些关键操作背后的逻辑。
一个 markdown 文件,51,000 颗 star。Google Stitch 发明的 DESIGN.md 概念,正在成为 AI Coding Agent 时代的设计系统新标准——本文带你完整理解它是什么、为什么有效,以及如何立刻用在你的项目里。
手把手教你用 Node.js + Vercel + OpenAI API 搭建一个最简单的 AI 聊天机器人,完整代码开源,从人设设计到部署上线一篇搞定。
Anthropic 推出 Managed Agents——托管式 Agent 运行时。本文以鬼哥的数字分身为案例,对比手搓版聊天机器人与 Managed Agents 托管版的差异,深入解析这个 'Claude Code as a Service' 的全部能力。
深度解析 Addy Osmani 的 agent-skills 项目——如何将 Google 14 年工程纪律编码为 19 个 AI Agent 可执行的 skill,以及为什么「反合理化」是对抗 AI 走捷径的最重要设计模式。
深度解析 Karpathy 提出的 LLM 知识库模式:从 1945 年 Memex 的构想到 2026 年的实现,从 RAG 的局限到知识编译的范式转换,以及如何从零构建你自己的 LLM Wiki。
Google 最新开源模型 Gemma 4 的架构革新、性能跃迁与五个有趣的实战应用场景。tau2-bench 从 6.6% 到 86.4%,单代提升 13 倍,开源 Agent 终于进入生产时代。
一次 Sonnet API 调用,输入 Token 价格 $3/百万,命中 Prompt Cache 降到 $0.30/百万。Claude Code 为此设计了精密的缓存分割和四级压缩体系,让长对话不至于'烧钱到心疼'。
Claude Code 的心脏是 query.ts 中一个 1,700 行的 while(true) 循环,实现了经典的 ReAct 模式。五个阶段逐层递进,七层恢复机制让系统在各种异常下自我修复。
Anthropic Claude Code CLI 完整源码泄露,512K 行 TypeScript 揭示了一个完整的 AI Agent 运行时架构:Bun 运行时、React+Ink 终端渲染、ReAct 主循环、七层错误恢复、五层记忆体系、投机执行与多 Agent 编排。
从 Prompt Engineering 到 Context Engineering 再到 Harness Engineering,梳理 AI Agent 工程化的三次范式跃迁,拆解头部公司的实践方案,并给出务实的行动路径。
全面解析 Claude Code 的 .claude/ 文件夹结构,包括 CLAUDE.md、自定义命令、Skills、Agents 和权限配置。
旧站清空重建,新的开始。