<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>NVIDIA on 鬼哥的空间</title><link>https://luoli523.github.io/tags/nvidia/</link><description>Recent content in NVIDIA on 鬼哥的空间</description><generator>Hugo -- gohugo.io</generator><language>zh-cn</language><lastBuildDate>Mon, 15 Jun 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://luoli523.github.io/tags/nvidia/index.xml" rel="self" type="application/rss+xml"/><item><title>桌面 AI Studio 怎么选：DGX Spark、Ryzen AI Halo 和 M4 Max Mac Studio</title><link>https://luoli523.github.io/p/desktop-ai-studio/</link><pubDate>Mon, 15 Jun 2026 00:00:00 +0000</pubDate><guid>https://luoli523.github.io/p/desktop-ai-studio/</guid><description>&lt;img src="https://luoli523.github.io/" alt="Featured image of post 桌面 AI Studio 怎么选：DGX Spark、Ryzen AI Halo 和 M4 Max Mac Studio" /&gt;&lt;p&gt;买桌面 AI 机器，最容易被一个数字骗：TOPS、TFLOPS、PFLOPS，听起来都像能把模型原地起飞。现实是，AI 开发者真正卡住的往往不是峰值算力，而是 &lt;strong&gt;内存够不够、软件栈顺不顺、模型能不能跑、跑起来以后能不能折腾&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;鬼哥最近就被这个问题挠得有点坐不住。&lt;/p&gt;
&lt;p&gt;我桌上现在已经有三台风格完全不同的本地 AI 设备：一台 &lt;strong&gt;M4 Max Mac Studio/Mac mini 形态的 Apple Silicon 小主机&lt;/strong&gt;，平时负责写代码、跑轻量本地模型、剪音视频、做各种 AI 开发实验；一台自己组的 &lt;strong&gt;GeForce RTX 4090 台式机&lt;/strong&gt;，专门拿来折腾 Ollama、本地模型推理、Agent 接入和性能测试；还有一块 &lt;strong&gt;Raspberry Pi 5 小卡&lt;/strong&gt;，更多是拿来提醒自己：边缘 AI 不是 PPT，它最后真的要落到这些又小又抠门的设备上。&lt;/p&gt;
&lt;p&gt;&lt;img alt="鬼哥的 4090 本地 AI 台式机" class="gallery-image" data-flex-basis="320px" data-flex-grow="133" height="1200" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/desktop-ai-studio/guige-4090-rig.webp" srcset="https://luoli523.github.io/p/desktop-ai-studio/guige-4090-rig_hu_edb61d0e495f5eb9.webp 800w, https://luoli523.github.io/p/desktop-ai-studio/guige-4090-rig.webp 1600w" width="1600"&gt;&lt;/p&gt;
&lt;p&gt;4090 那台机器我之前专门写过一篇实测：&lt;a class="link" href="https://luoli523.github.io/p/ollama-local-dev/" &gt;《一张 4090 跑 Gemma4 26B：用 Ollama 搭本地 AI 开发环境实测》&lt;/a&gt;。结果挺有意思：Gemma4 26B 在那台机器上持续输出大约 &lt;strong&gt;160 tokens/s&lt;/strong&gt;，模型加载后显存占用约 &lt;strong&gt;24.5GB&lt;/strong&gt;，长输出功耗能到 &lt;strong&gt;260W+&lt;/strong&gt;。这已经不是“本地模型能不能跑”的问题，而是“本地模型怎么接进真实开发工作流”的问题。&lt;/p&gt;
&lt;p&gt;&lt;img alt="鬼哥的 Apple Silicon 开发小主机" class="gallery-image" data-flex-basis="320px" data-flex-grow="133" height="1200" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/desktop-ai-studio/guige-macmini.webp" srcset="https://luoli523.github.io/p/desktop-ai-studio/guige-macmini_hu_a28b1e3e3d64acaf.webp 800w, https://luoli523.github.io/p/desktop-ai-studio/guige-macmini.webp 1600w" width="1600"&gt;&lt;/p&gt;
&lt;p&gt;Mac 这边则完全是另一种体验：它不一定是大模型推理冠军，但它安静、稳定、顺手。写博客、跑 Claude/Codex、剪视频、处理图片、做前端 demo、顺手跑个 llama.cpp 或 MLX 模型，整个工作流几乎没有摩擦。缺点也很诚实：一碰到大模型、CUDA-only 项目、训练脚本复现，它就会提醒你“这里不是我的主场”。&lt;/p&gt;
&lt;p&gt;&lt;img alt="鬼哥的 Raspberry Pi 5 小卡" class="gallery-image" data-flex-basis="135px" data-flex-grow="56" height="2048" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/desktop-ai-studio/guige-raspberrypi.webp" srcset="https://luoli523.github.io/p/desktop-ai-studio/guige-raspberrypi_hu_748778f97081a53.webp 800w, https://luoli523.github.io/p/desktop-ai-studio/guige-raspberrypi.webp 1152w" width="1152"&gt;&lt;/p&gt;
&lt;p&gt;树莓派更像一个现实锚点。它告诉我：AI 硬件不是只有“越大越好”这一条路。很多时候你真正想要的是低功耗、常开、便宜、可部署，而不是一个会把房间变暖的模型发动机。&lt;/p&gt;
&lt;p&gt;所以，当 NVIDIA DGX Spark 和 AMD Ryzen AI Halo 相继把“桌面级个人 AI 工作站”摆上台面时，我第一反应不是“哇，又来了两台神机”，而是：&lt;strong&gt;它们到底能不能补上我现有三台设备各自的短板？&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;更麻烦的是，Apple 这边我还在翘首以盼，眼泪汪汪地等 M5 Mac mini/Mac Studio 更新。于是这篇文章就变成了一次很现实的调研：不是纯参数表，也不是厂商发布会复读，而是从一个极客的桌面出发，看看 DGX Spark、Ryzen AI Halo 和 M4 Max Mac Studio 到底分别适合谁。&lt;/p&gt;
&lt;p&gt;NVIDIA DGX Spark、AMD Ryzen AI Halo、M4 Max Mac Studio，表面上都叫桌面级 AI Studio。其实它们不是三台同类机器，而是三种路线：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;NVIDIA&lt;/strong&gt;：把数据中心 AI 栈压到桌面，核心卖点是 CUDA 生态和 DGX 软件体验。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;AMD&lt;/strong&gt;：用 x86 APU + ROCm + Windows/Linux 抢本地 AI 开发者，核心卖点是开放 PC 工作流和 128GB 统一内存。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Apple&lt;/strong&gt;：把成熟创作工作站顺手变成 AI 开发机，核心卖点是安静、省心、macOS 体验，但不是大模型怪兽。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;img alt="三条桌面 AI 路线：CUDA、ROCm、Apple Silicon" class="gallery-image" data-flex-basis="426px" data-flex-grow="177" height="941" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/desktop-ai-studio/cover.webp" srcset="https://luoli523.github.io/p/desktop-ai-studio/cover_hu_21f50c394da80d27.webp 800w, https://luoli523.github.io/p/desktop-ai-studio/cover_hu_ab34dfb3fb9b9913.webp 1600w, https://luoli523.github.io/p/desktop-ai-studio/cover.webp 1672w" width="1672"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="先看规格但别被规格牵着走"&gt;先看规格，但别被规格牵着走
&lt;/h2&gt;&lt;p&gt;为了避免玄学，先把官方能确认的硬指标摆出来。这里的重点不是谁的数字最大，而是这些数字分别服务什么场景。&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;机器&lt;/th&gt;
 &lt;th&gt;核心芯片&lt;/th&gt;
 &lt;th style="text-align: right"&gt;统一内存&lt;/th&gt;
 &lt;th style="text-align: right"&gt;内存带宽&lt;/th&gt;
 &lt;th&gt;AI/图形算力口径&lt;/th&gt;
 &lt;th&gt;系统&lt;/th&gt;
 &lt;th&gt;典型定位&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;NVIDIA DGX Spark&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;GB10 Grace Blackwell&lt;/td&gt;
 &lt;td style="text-align: right"&gt;128GB LPDDR5x&lt;/td&gt;
 &lt;td style="text-align: right"&gt;273GB/s&lt;/td&gt;
 &lt;td&gt;最高 1 PFLOP FP4&lt;/td&gt;
 &lt;td&gt;DGX OS&lt;/td&gt;
 &lt;td&gt;本地 Agent、LLM 推理、CUDA 原型&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;AMD Ryzen AI Halo&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;Ryzen AI Max+ 395&lt;/td&gt;
 &lt;td style="text-align: right"&gt;128GB LPDDR5x&lt;/td&gt;
 &lt;td style="text-align: right"&gt;官方页面未列&lt;/td&gt;
 &lt;td&gt;60 FP16 TFLOPS GPU + 50 TOPS NPU&lt;/td&gt;
 &lt;td&gt;Windows 或 Linux&lt;/td&gt;
 &lt;td&gt;ROCm、本地 LLM、ComfyUI、PC AI 开发&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;M4 Max Mac Studio&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;M4 Max&lt;/td&gt;
 &lt;td style="text-align: right"&gt;36GB，最高 64GB&lt;/td&gt;
 &lt;td style="text-align: right"&gt;410GB/s，最高 546GB/s&lt;/td&gt;
 &lt;td&gt;40 核 GPU + 16 核 Neural Engine&lt;/td&gt;
 &lt;td&gt;macOS&lt;/td&gt;
 &lt;td&gt;开发主机、创作工作流、中小模型实验&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;如果只看表格，你可能会得出一个很粗暴的结论：DGX Spark 和 Ryzen AI Halo 是本地大模型机器，M4 Max Mac Studio 是“顺便跑 AI”的工作站。&lt;/p&gt;
&lt;p&gt;这个结论大体没错，但还不够精确。&lt;/p&gt;
&lt;p&gt;更准确的说法是：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&lt;strong&gt;DGX Spark 买的是 NVIDIA AI 栈，Ryzen AI Halo 买的是大内存 PC 路线，M4 Max Mac Studio 买的是低摩擦开发体验。&lt;/strong&gt;&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;这三句话比任何 TOPS 数字都重要。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="第一层分水岭本地大模型先看内存"&gt;第一层分水岭：本地大模型先看内存
&lt;/h2&gt;&lt;p&gt;本地 LLM 的第一堵墙不是算力，是内存。&lt;/p&gt;
&lt;p&gt;一个 70B 模型即使用 4-bit 量化，权重也常常要三四十 GB，再加上 KV cache、上下文、运行时开销、并发请求，很快就会把 64GB 机器逼到墙角。到了 120B、200B 这种级别，128GB 统一内存才开始有“能把东西装进去”的讨论资格。&lt;/p&gt;
&lt;p&gt;这就是 DGX Spark 和 Ryzen AI Halo 的共同点：它们都把 &lt;strong&gt;128GB 统一内存&lt;/strong&gt; 放到了桌面小机器里。&lt;/p&gt;
&lt;p&gt;NVIDIA 官方给 DGX Spark 的定位很明确：128GB coherent unified system memory，可以在桌面运行最高 200B 参数模型的开发和测试工作，也可以微调最高 70B 参数模型。这个说法要谨慎理解：它不是承诺任何 200B 模型都能满血高吞吐跑，而是在告诉你，&lt;strong&gt;内存容量已经足够让这类模型进入本地实验范围&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;AMD 的路线更像“PC 阵营的反击”。Ryzen AI Halo 开发平台同样是 128GB LPDDR5x 统一内存，并且官方强调 Windows 或 Linux 双系统、完整 ROCm 支持。对很多极客来说，这比 DGX OS 更有吸引力：你可以把它当本地 AI 服务器，也可以把它当一台能跑 Windows 软件的高端小主机。&lt;/p&gt;
&lt;p&gt;M4 Max Mac Studio 的问题就在这里。M4 Max 版本最高 64GB 统一内存，带宽最高 546GB/s，带宽很漂亮，但容量不在一个级别。对于 7B、14B、32B 量化模型，它可以玩得很舒服；但如果你的目标是长期折腾 70B 以上模型，64GB 会让你不停做取舍。&lt;/p&gt;
&lt;p&gt;&lt;img alt="本地大模型的内存墙：64GB、128GB 与模型规模" class="gallery-image" data-flex-basis="426px" data-flex-grow="177" height="941" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/desktop-ai-studio/memory-wall.webp" srcset="https://luoli523.github.io/p/desktop-ai-studio/memory-wall_hu_b720426ddd907364.webp 800w, https://luoli523.github.io/p/desktop-ai-studio/memory-wall_hu_8f502ae911cbe70f.webp 1600w, https://luoli523.github.io/p/desktop-ai-studio/memory-wall.webp 1672w" width="1672"&gt;&lt;/p&gt;
&lt;p&gt;一个极客版判断：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;场景&lt;/th&gt;
 &lt;th&gt;64GB Mac Studio&lt;/th&gt;
 &lt;th&gt;128GB DGX Spark / Ryzen AI Halo&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;7B/14B 本地助手&lt;/td&gt;
 &lt;td&gt;很舒服&lt;/td&gt;
 &lt;td&gt;轻松&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;32B 量化模型&lt;/td&gt;
 &lt;td&gt;可用，需控制上下文&lt;/td&gt;
 &lt;td&gt;更从容&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;70B 量化推理&lt;/td&gt;
 &lt;td&gt;能折腾，但容易受限&lt;/td&gt;
 &lt;td&gt;进入主战场&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;70B 微调/LoRA&lt;/td&gt;
 &lt;td&gt;不适合作为主力&lt;/td&gt;
 &lt;td&gt;DGX Spark 更对口&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;120B/200B 实验&lt;/td&gt;
 &lt;td&gt;基本不是甜点区&lt;/td&gt;
 &lt;td&gt;有实验价值&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;所以，如果你关心的是“我能不能在桌面上把更大的模型塞进去”，答案很直接：&lt;strong&gt;128GB 机器先赢一半。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;这也是我看 DGX Spark 和 Ryzen AI Halo 会心痒的原因。4090 台式机的推理速度很香，但显存墙是真实存在的；Mac 的统一内存体验很顺，但 M4 Max 的上限又不够“放肆”。128GB 统一内存的吸引力，不是参数洁癖，而是它允许你少做很多“这个模型能不能塞进去”的心算。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="第二层分水岭软件栈决定你折腾多久"&gt;第二层分水岭：软件栈决定你折腾多久
&lt;/h2&gt;&lt;p&gt;AI 硬件最残酷的地方在于：跑分截图很好看，环境配置很难看。&lt;/p&gt;
&lt;p&gt;同样是本地 AI Studio，三家的软件体验差异非常大。&lt;/p&gt;
&lt;h3 id="dgx-sparkcuda-是护城河也是笼子"&gt;DGX Spark：CUDA 是护城河，也是笼子
&lt;/h3&gt;&lt;p&gt;&lt;img alt="NVIDIA DGX Spark 官方宣传图" class="gallery-image" data-flex-basis="457px" data-flex-grow="190" height="630" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/desktop-ai-studio/dgx-spark-official.webp" srcset="https://luoli523.github.io/p/desktop-ai-studio/dgx-spark-official_hu_dcc5092796665042.webp 800w, https://luoli523.github.io/p/desktop-ai-studio/dgx-spark-official.webp 1200w" width="1200"&gt;&lt;/p&gt;
&lt;p&gt;DGX Spark 最大的优势不是 1 PFLOP FP4，而是 &lt;strong&gt;NVIDIA AI 软件栈默认站在你这边&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;CUDA、TensorRT、NIM、NVIDIA AI Enterprise、DGX OS、开发者论坛、官方 playbook，这些东西加起来，意味着你遇到问题时更容易找到“前人已经踩过的坑”。如果你的工作流最后要上 NVIDIA 数据中心或云 GPU，DGX Spark 的意义就更明显：它是一台桌面上的原型机。&lt;/p&gt;
&lt;p&gt;我在 4090 上折腾 Ollama、Codex、Claude Code 和 Hermes 时，最大的感受就是：&lt;strong&gt;模型速度只是第一层，工具链稳定性才是第二层&lt;/strong&gt;。同一个本地模型，Claude Code 能顺利读文件，Codex 在某些 Linux sandbox 环境里会被权限卡住。这个体验会让人更理解 DGX Spark 的价值：它卖的不是“我也有一颗 GPU”，而是尽量把硬件、驱动、框架、playbook 和支持路径绑成一套。&lt;/p&gt;
&lt;p&gt;它的限制也同样清楚：DGX Spark 官方规格写的是 DGX OS。你不是在买一台泛用 PC，而是在买一台 NVIDIA 定义好的 AI appliance。对于研究者和企业开发者，这是省心；对于喜欢乱装系统、乱插外设、乱改内核的极客，这可能会有点憋。&lt;/p&gt;
&lt;h3 id="ryzen-ai-halorocm-的机会也是变量"&gt;Ryzen AI Halo：ROCm 的机会，也是变量
&lt;/h3&gt;&lt;p&gt;&lt;img alt="AMD Ryzen AI Halo 官方产品展开图" class="gallery-image" data-flex-basis="182px" data-flex-grow="76" height="675" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/desktop-ai-studio/ryzen-ai-halo-official.webp" width="513"&gt;&lt;/p&gt;
&lt;p&gt;AMD 的牌面是：Windows/Linux + ROCm + 128GB 内存 + x86。&lt;/p&gt;
&lt;p&gt;这很诱人。你可以在 Linux 上跑模型，在 Windows 上跑创作和开发工具，还能享受普通 PC 生态的弹性。AMD 页面还直接把自己和 DGX Spark 对比，脚注里写到：测试使用预生产 Ryzen AI Halo、128GB LPDDR5x、Linux OS，对比 DGX Spark，并列出 AMD Ryzen AI Halo $3999、DGX Spark $4699 的零售价。&lt;/p&gt;
&lt;p&gt;但 ROCm 仍然是变量。它比前几年成熟太多，很多 PyTorch 和推理框架已经能跑，但 AI 生态的默认答案依然常常是 CUDA。你要有心理准备：同一个模型，同一个项目，NVIDIA 用户可能 &lt;code&gt;pip install&lt;/code&gt; 后直接跑，AMD 用户可能要查 issue、换 wheel、等适配。&lt;/p&gt;
&lt;p&gt;这不是说 AMD 不值得买，而是它更适合 &lt;strong&gt;愿意换性能/价格/开放性，但能接受折腾成本的人&lt;/strong&gt;。&lt;/p&gt;
&lt;h3 id="mac-studio最舒服但不是最开放"&gt;Mac Studio：最舒服，但不是最开放
&lt;/h3&gt;&lt;p&gt;Apple 的 AI 开发体验很奇特：它不是最强的，但往往是最顺的。&lt;/p&gt;
&lt;p&gt;如果你的日常是写代码、跑中小模型、做 demo、剪视频、处理图片、调 UI、用 MLX 或 llama.cpp 跑本地模型，Mac Studio 会非常舒服。它安静、省电、系统稳定、开发工具成熟，而且 M4 Max 的 CPU/GPU/媒体引擎组合对创作者非常友好。&lt;/p&gt;
&lt;p&gt;这也是我现在离不开 Mac 的原因。很多 AI 项目不是一天 24 小时都在跑模型，大量时间其实是在写胶水代码、改提示词、整理素材、剪一段 demo 视频、处理博客图片、部署网页、调试工具链。这个阶段 Mac 的低摩擦体验非常强：你不会因为驱动、风噪、电源、桌面空间这些小事分心。&lt;/p&gt;
&lt;p&gt;问题是，一旦你进入主流深度学习训练、CUDA-only 项目、复杂推理优化、企业级 GPU 部署对齐，macOS 就会露出边界。Metal、MLX、Core ML 都很好，但它们不是 AI 研究社区的默认地面。&lt;/p&gt;
&lt;p&gt;&lt;img alt="三套软件栈：CUDA、ROCm、MLX/Metal" class="gallery-image" data-flex-basis="426px" data-flex-grow="177" height="941" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/desktop-ai-studio/software-stack.webp" srcset="https://luoli523.github.io/p/desktop-ai-studio/software-stack_hu_d7b395f7740e6adf.webp 800w, https://luoli523.github.io/p/desktop-ai-studio/software-stack_hu_c3b041fb5eb74849.webp 1600w, https://luoli523.github.io/p/desktop-ai-studio/software-stack.webp 1672w" width="1672"&gt;&lt;/p&gt;
&lt;p&gt;如果用一句话概括：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;软件栈&lt;/th&gt;
 &lt;th&gt;最舒服的用户&lt;/th&gt;
 &lt;th&gt;最痛的地方&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;CUDA / DGX OS&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;想和 NVIDIA 生产环境对齐的人&lt;/td&gt;
 &lt;td&gt;泛用 PC 自由度低&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;ROCm / Windows / Linux&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;喜欢开放硬件和 PC 工作流的人&lt;/td&gt;
 &lt;td&gt;生态适配仍需耐心&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;MLX / Metal / macOS&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;需要一台安静全能开发主机的人&lt;/td&gt;
 &lt;td&gt;大模型和训练生态不是主场&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;hr&gt;
&lt;h2 id="第三层分水岭你到底要跑什么"&gt;第三层分水岭：你到底要跑什么
&lt;/h2&gt;&lt;p&gt;“AI 开发者”这个词太宽了。写 RAG 应用、做模型微调、玩 ComfyUI、跑机器人仿真、做科研复现实验，根本不是一类需求。&lt;/p&gt;
&lt;p&gt;下面按真实工作流拆。&lt;/p&gt;
&lt;h3 id="1-本地-llm-推理和-agent-开发"&gt;1. 本地 LLM 推理和 Agent 开发
&lt;/h3&gt;&lt;p&gt;如果你要做的是本地 Agent、RAG、长上下文代码助手、私有知识库问答，DGX Spark 和 Ryzen AI Halo 明显更像主力机器。&lt;/p&gt;
&lt;p&gt;DGX Spark 的优势是 NVIDIA 官方已经把“本地自主 Agent”写进产品定位。它有 128GB 内存、NVIDIA 软件栈和面向 Agentic workload 的 playbook。你想做的是“本地先跑，未来迁到 NVIDIA 云或数据中心”，DGX Spark 的路径更直。&lt;/p&gt;
&lt;p&gt;Ryzen AI Halo 的优势是自由度和价格。AMD 官方把它定位成 AI developer platform，而且支持 Windows/Linux。你可以把它放在桌上当小服务器，也可以 SSH 进去跑服务，还可以接普通 PC 工作流。对独立开发者和极客来说，这种弹性很香。&lt;/p&gt;
&lt;p&gt;Mac Studio 不是不能做 Agent。相反，很多开发者会更喜欢在 macOS 上写代码、调工具、跑本地小模型。只是当 Agent 需要更大模型、更长上下文、更高并发时，M4 Max 的 64GB 上限会让它更像“开发控制台”，而不是“模型发动机”。&lt;/p&gt;
&lt;p&gt;我的实际分工大概是这样：Mac 负责“人机交互”和日常开发，4090 负责“重推理”和性能测试。如果本地模型要长期作为服务跑，我更愿意让它待在一台可以 SSH、可以监控、可以随时重启的盒子里，而不是占着我的主力开发桌面。按这个逻辑，Ryzen AI Halo 这种 128GB 小盒子会非常诱人；DGX Spark 则更像“如果我要认真走 NVIDIA Agent 路线，就别自己东拼西凑了”。&lt;/p&gt;
&lt;h3 id="2-微调lora-和科研复现"&gt;2. 微调、LoRA 和科研复现
&lt;/h3&gt;&lt;p&gt;这一类需求更偏向 DGX Spark。&lt;/p&gt;
&lt;p&gt;NVIDIA 官方直接写了 Fine-Tuning：用 128GB 统一内存微调最高 70B 参数模型。这里最关键的不是一句营销文案，而是它背后的现实：大量训练、微调、量化、推理优化工具默认优先支持 CUDA。&lt;/p&gt;
&lt;p&gt;Ryzen AI Halo 也能做一部分微调和实验，尤其是 ROCm 支持越来越完整之后。但如果你是研究者，目标是快速复现论文、跑开源训练脚本、少改代码，CUDA 仍然是阻力最小的路线。&lt;/p&gt;
&lt;p&gt;Mac Studio 适合做算法原型、数据处理、小模型实验、MLX 生态尝鲜，但不适合作为“我要复现各种 GitHub 训练项目”的唯一主机。你当然可以折腾，但很多时候不是硬件不行，是生态把你绕远了。&lt;/p&gt;
&lt;h3 id="3-comfyui图像生成和多模态玩法"&gt;3. ComfyUI、图像生成和多模态玩法
&lt;/h3&gt;&lt;p&gt;这个场景 AMD 反而很有看点。&lt;/p&gt;
&lt;p&gt;AMD 页面把 ComfyUI、Visual Studio Code、Python 等预装/同步工具放进 Ryzen AI Halo 的开发者体验里，并且官方测试脚注覆盖了 Stable Diffusion XL、Flux、Qwen Image、Wan 等图像和视频相关工作负载。这里要注意：厂商自测不能当第三方基准，但至少说明 AMD 非常清楚它要争夺哪类用户。&lt;/p&gt;
&lt;p&gt;NVIDIA 当然也强，尤其是各种 CUDA 优化的图像生成工具链仍然更成熟。DGX Spark 的问题不是能力，而是“值不值”：如果你的主要玩法是 ComfyUI 和图片生成，买 DGX Spark 可能有点像为了煎蛋买实验室设备。&lt;/p&gt;
&lt;p&gt;Mac Studio 的优势在创作闭环：图片、视频、剪辑、设计、开发都在一台安静机器上完成。它不一定是生成速度冠军，但它可能是最不打断创作流的机器。&lt;/p&gt;
&lt;p&gt;我自己的感受是：音视频和内容生产这类任务，&lt;strong&gt;峰值性能不是唯一指标，工作流连续性更重要&lt;/strong&gt;。一段视频从素材整理、脚本、配音、剪辑、封面、发布，中间会不断在浏览器、编辑器、终端、设计工具之间切换。Mac 在这里很舒服。4090 更像一个加速器：当你明确知道要批量生成、批量推理、批量转码时，把任务扔给它；但日常创作的主控台，我还是更愿意放在 Mac 上。&lt;/p&gt;
&lt;h3 id="4-机器人边缘-ai-和硬件项目"&gt;4. 机器人、边缘 AI 和硬件项目
&lt;/h3&gt;&lt;p&gt;这类场景 DGX Spark 的 NVIDIA 生态优势最明显。&lt;/p&gt;
&lt;p&gt;NVIDIA 官方明确提到 Isaac、Metropolis、Holoscan 等边缘应用框架。你如果做机器人、视觉检测、边缘推理、智能摄像头原型，NVIDIA 从桌面到 Jetson 到数据中心的生态连贯性很强。&lt;/p&gt;
&lt;p&gt;AMD Ryzen AI Halo 也能做边缘 AI 原型，但它更像“高性能 PC 盒子”。Mac Studio 则适合作为开发主机和可视化工作站，而不是硬件生态中心。&lt;/p&gt;
&lt;p&gt;树莓派 5 在这里给我的提醒很直接：边缘设备上最稀缺的不是“能不能跑一个模型 demo”，而是功耗、散热、常开稳定性、部署维护和成本。桌面 AI Studio 如果只是跑分强，未必能帮助你真正理解边缘场景；但如果它能让你快速训练、量化、测试，再把结果下放到小设备，那才是完整链路。&lt;/p&gt;
&lt;p&gt;&lt;img alt="不同 AI 工作流对应的最佳机器" class="gallery-image" data-flex-basis="426px" data-flex-grow="177" height="941" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/desktop-ai-studio/workflow-map.webp" srcset="https://luoli523.github.io/p/desktop-ai-studio/workflow-map_hu_cf5f430b510d5bf7.webp 800w, https://luoli523.github.io/p/desktop-ai-studio/workflow-map_hu_8d7dc007daa130b8.webp 1600w, https://luoli523.github.io/p/desktop-ai-studio/workflow-map.webp 1672w" width="1672"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="价格可以看但别只看价格"&gt;价格可以看，但别只看价格
&lt;/h2&gt;&lt;p&gt;按 AMD 官方脚注，2026 年 5 月测试口径里，Ryzen AI Halo 零售价为 &lt;strong&gt;$3999&lt;/strong&gt;，DGX Spark 零售价为 &lt;strong&gt;$4699&lt;/strong&gt;。Apple 的 M4 Max Mac Studio 官方规格页能确认配置，但价格会随芯片、内存、存储和地区变化，实际应以 Apple 配置页为准。&lt;/p&gt;
&lt;p&gt;但这篇文章不建议把价格当第一决策因子。&lt;/p&gt;
&lt;p&gt;原因很简单：对 AI 开发者来说，真正贵的不是多花几百美元，而是 &lt;strong&gt;买回来以后三个月都在和驱动、依赖、模型格式、内存限制较劲&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;更合理的价格问题应该这样问：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;你真正购买的是&lt;/th&gt;
 &lt;th&gt;应该问的问题&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;DGX Spark&lt;/td&gt;
 &lt;td&gt;我是否需要 CUDA/DGX/NVIDIA 生产环境一致性？&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Ryzen AI Halo&lt;/td&gt;
 &lt;td&gt;我是否愿意用折腾成本换 128GB、x86 和 Windows/Linux 弹性？&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;M4 Max Mac Studio&lt;/td&gt;
 &lt;td&gt;我是否更需要一台舒服的主力开发/创作机，而不是最大模型机器？&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;如果答案是“我要少踩坑，跟 NVIDIA 生产栈对齐”，DGX Spark 的溢价有意义。&lt;/p&gt;
&lt;p&gt;如果答案是“我要一台能跑大模型、能装 Windows/Linux、还能当 PC 用的极客盒子”，Ryzen AI Halo 更有吸引力。&lt;/p&gt;
&lt;p&gt;如果答案是“我每天要写代码、剪视频、做产品 demo，偶尔跑本地模型”，Mac Studio 可能才是最理性的选择。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="三类人怎么选"&gt;三类人怎么选
&lt;/h2&gt;&lt;h3 id="ai-应用开发者"&gt;AI 应用开发者
&lt;/h3&gt;&lt;p&gt;你关心的是 RAG、Agent、私有知识库、本地 API、开发效率。&lt;/p&gt;
&lt;p&gt;我的排序：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;Ryzen AI Halo&lt;/strong&gt;：如果你愿意折腾 ROCm，它的 128GB 内存和 Windows/Linux 弹性很适合做本地 AI 服务盒子。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;DGX Spark&lt;/strong&gt;：如果你的应用未来要上 NVIDIA GPU，或者你需要 CUDA/NIM/DGX playbook，优先选它。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;M4 Max Mac Studio&lt;/strong&gt;：适合作为开发主机，不适合作为大模型主力推理服务器。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;鬼哥经验：如果你的开发工作流已经像我一样被 Mac 绑住，不一定要把“主力开发机”和“本地模型服务器”合并成一台。更舒服的架构反而是：Mac 负责写代码和调产品，旁边放一台 128GB AI 小盒子长期跑模型服务。&lt;/p&gt;
&lt;h3 id="研究者和实验室"&gt;研究者和实验室
&lt;/h3&gt;&lt;p&gt;你关心的是论文复现、微调、训练脚本兼容、长期维护。&lt;/p&gt;
&lt;p&gt;我的排序：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;DGX Spark&lt;/strong&gt;：CUDA 生态仍然是研究代码的默认路径，少改代码就是生产力。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Ryzen AI Halo&lt;/strong&gt;：适合预算敏感、愿意参与 ROCm 生态、需要 Windows/Linux 弹性的团队。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;M4 Max Mac Studio&lt;/strong&gt;：适合数据处理、写作、可视化、小模型原型，不建议作为唯一 AI 计算节点。&lt;/li&gt;
&lt;/ol&gt;
&lt;h3 id="ai-极客"&gt;AI 极客
&lt;/h3&gt;&lt;p&gt;你关心的是可玩性、模型规模、系统自由度、折腾空间。&lt;/p&gt;
&lt;p&gt;我的排序反而会变：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;Ryzen AI Halo&lt;/strong&gt;：x86、128GB、Windows/Linux、ROCm，能折腾的面最大。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;DGX Spark&lt;/strong&gt;：如果你想玩 NVIDIA 最新桌面 AI appliance，它很酷，但自由度不一定最高。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;M4 Max Mac Studio&lt;/strong&gt;：体验最好，折腾空间相对最小；适合“我要做东西”，不适合“我要拆机器边界”。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这里我会额外加一句：如果你已经有 4090 台式机，Ryzen AI Halo 和 DGX Spark 不一定是“性能升级”，更可能是“形态升级”。它们吸引人的地方是小、安静、统一内存、可常开，而不是一定能在所有任务里打爆一张高端独显。&lt;/p&gt;
&lt;p&gt;&lt;img alt="三类用户的选择矩阵" class="gallery-image" data-flex-basis="426px" data-flex-grow="177" height="941" loading="lazy" sizes="(max-width: 767px) calc(100vw - 30px), (max-width: 1023px) 700px, (max-width: 1279px) 950px, 1232px" src="https://luoli523.github.io/p/desktop-ai-studio/decision-matrix.webp" srcset="https://luoli523.github.io/p/desktop-ai-studio/decision-matrix_hu_becf787f1ecd3b72.webp 800w, https://luoli523.github.io/p/desktop-ai-studio/decision-matrix_hu_5fb9e4680eb7ac60.webp 1600w, https://luoli523.github.io/p/desktop-ai-studio/decision-matrix.webp 1672w" width="1672"&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="我的最终判断"&gt;我的最终判断
&lt;/h2&gt;&lt;p&gt;如果你把这三台机器都叫“桌面 AI Studio”，会看花眼；如果你把它们看成三条路线，选择就清楚了。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;DGX Spark 是桌面版 NVIDIA AI 路线。&lt;/strong&gt; 它适合研究者、企业开发者、Agent 原型团队，以及任何未来要迁移到 NVIDIA 云或数据中心的人。它不是最自由的机器，但它最像一条铺好的路。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;Ryzen AI Halo 是 PC 阵营的本地 AI 路线。&lt;/strong&gt; 它适合极客、独立开发者、小团队和愿意赌 ROCm 继续成熟的人。它的吸引力不只是便宜几百美元，而是 128GB 统一内存加 Windows/Linux 弹性。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;M4 Max Mac Studio 是创作和开发主机路线。&lt;/strong&gt; 它适合已经在 Apple 生态里、重视安静稳定、需要代码/视频/图像/产品 demo 一体化的人。它可以跑 AI，但不要把它想象成 DGX Spark 或 Ryzen AI Halo 的同类竞品。&lt;/p&gt;
&lt;p&gt;至于我自己，如果现在必须下单，我大概率不会把 Mac 替换掉。Mac 仍然是我的主力创作和开发桌面；4090 台式机会继续承担重推理和测试；树莓派继续做边缘实验。真正让我心痒的是：&lt;strong&gt;能不能在这三者之外，再加一台 128GB、低功耗、可常开的本地模型盒子&lt;/strong&gt;。DGX Spark 和 Ryzen AI Halo 的竞争，正好打在这个空位上。&lt;/p&gt;
&lt;p&gt;但我也会继续等 Apple 的 M5 Mac mini/Mac Studio。不是因为我相信 Apple 会突然变成 CUDA 平替，而是因为 Apple 如果把统一内存容量、NPU/Metal/MLX 生态和桌面小主机形态继续往前推，它仍然可能成为最舒服的“AI 开发主控台”。&lt;/p&gt;
&lt;p&gt;一句话版：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;如果你最在意&lt;/th&gt;
 &lt;th&gt;选&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;CUDA、微调、科研复现、NVIDIA 生产环境对齐&lt;/td&gt;
 &lt;td&gt;&lt;strong&gt;DGX Spark&lt;/strong&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;128GB、大模型、本地服务、Windows/Linux、极客可玩性&lt;/td&gt;
 &lt;td&gt;&lt;strong&gt;Ryzen AI Halo&lt;/strong&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;macOS、安静稳定、开发创作一体、中小模型实验&lt;/td&gt;
 &lt;td&gt;&lt;strong&gt;M4 Max Mac Studio&lt;/strong&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;本地 AI 的下一阶段，拼的不是谁喊出更大的 TOPS，而是谁能让开发者在桌面上更快完成一个闭环：&lt;strong&gt;模型能装进去，工具能跑起来，结果能用出去。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;如果只买一台，我会先问自己一个很土但很有效的问题：&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;这台机器买回来以后，我是每天用它做东西，还是每天用它证明它能跑东西？&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;前者买工作流，后者买玩具。两者都没错，但别买错。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="参考资料"&gt;参考资料
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class="link" href="https://www.nvidia.com/en-us/products/workstations/dgx-spark/" target="_blank" rel="noopener"
 &gt;NVIDIA DGX Spark 官方页面&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://www.amd.com/en/products/processors/desktops/ryzen/ryzen-ai-halo.html" target="_blank" rel="noopener"
 &gt;AMD Ryzen AI Halo 官方页面&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://www.apple.com/mac-studio/specs/" target="_blank" rel="noopener"
 &gt;Apple Mac Studio 技术规格&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://www.apple.com/shop/buy-mac/mac-studio" target="_blank" rel="noopener"
 &gt;Apple Mac Studio 购买配置页&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class="link" href="https://luoli523.github.io/p/ollama-local-dev/" &gt;鬼哥：一张 4090 跑 Gemma4 26B：用 Ollama 搭本地 AI 开发环境实测&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;图片来源：NVIDIA DGX Spark 官方页面、AMD Ryzen AI Halo 官方页面&lt;/li&gt;
&lt;/ul&gt;</description></item></channel></rss>