之前微软把 Windows 11 的本地 AI 功能锁在 Copilot+ PC 上,必须要有 NPU(神经处理单元)才能用。昨天 WindowsLatest 报道了一个变化:Windows 11 六月更新后,RTX 30 系列及更新显卡、6GB 以上 VRAM 的机型也能跑本地 AI 了。
这意味着什么?常规游戏显卡也能当推理卡用了。不需要专门买 NPU 硬件,手头有一块 RTX 3060 或以上的卡就能跑 Windows 上的本地模型。
几个值得关注的部署角度:
推理硬件门槛在下移。之前本地 AI 的主要限制是显存——7B 量化模型大约需要 4~6GB,13B 需要 8~10GB,33B 就奔着 20GB 去了。RTX 30 系列的 6GB 基准线正好卡在能跑 7B 量化模型的边缘。对部署来说,本地推理的可及硬件池在扩大。
Windows 作为推理平台的成熟度。Windows 的本地推理生态一直在碎片化的状态:Ollama 跑 WSL、LM Studio 原生跑、llama.cpp 编译跑。微软这次把本地 AI 内置到操作系统层面,意味着推理的驱动层优化和显存管理可能得到系统级支持。这对企业 IT 批量部署 Windows 终端做本地推理是个信号。
Copilot+ 的定位在变化。如果普通 RTX 卡也能跑,Copilot+ 的 NPU 优势就变成锦上添花而非门槛了。对部署者来说,多了硬件选型的弹性,但也多了碎片化的考量——NPU、GPU、CPU 三种推理路径,部署时得根据实际负载选。
内容来源:
WindowsLatest: Microsoft is killing the Copilot+ PC advantage, brings Windows 11’s local AI to RTX 30+ PCs with 6GB VRAM
HN 讨论在 news.ycombinator.com 上也有相关讨论