|
本地运行计算机操作Agent:Holo3.1——本地部署GUI自动化模型的可行性与算力门槛
|
|
8
|
64
|
2026 年6 月 2 日
|
|
一台10年前的Xeon就够跑Gemma 4了——多路推理也许是部署降本的另一条路
|
|
6
|
69
|
2026 年6 月 1 日
|
|
连续批处理的异步化:推理服务吞吐瓶颈不一定在模型上
|
|
0
|
4
|
2026 年6 月 1 日
|
|
从调度和缓存看 LLM 推理上生产:别只盯模型榜单
|
|
0
|
8
|
2026 年6 月 1 日
|
|
DeepSeek V4 预览版发布,推理部署的格局开始微妙了
|
|
8
|
32
|
2026 年5 月 31 日
|
|
前沿模型在真实企业IT任务中正确率不到50%——AI Agent 离「能干活」还有多远?
|
|
6
|
21
|
2026 年5 月 31 日
|
|
Claude Opus 4.8 上线:更偏 agent 任务,价格没变,部署侧更值得看什么?
|
|
0
|
37
|
2026 年5 月 29 日
|
|
vLLM 本地部署实战:先把 OpenAI 兼容接口跑起来,再谈优化
|
|
0
|
56
|
2026 年5 月 29 日
|
|
vLLM Eagle 3.1:推理加速这件事,开始从“模型快”变成“系统配合”
|
|
5
|
40
|
2026 年5 月 27 日
|
|
本地小模型重新变香?ai 成本不一定只靠追前沿模型解决
|
|
7
|
96
|
2026 年5 月 27 日
|
|
从 Using AI to write better code more slo 看 AI 编程工具的真实落地成本
|
|
0
|
12
|
2026 年5 月 27 日
|
|
Stack Overflow's forum is dead thanks to AI:一个偏部署视角的观察
|
|
6
|
11
|
2026 年5 月 27 日
|
|
新开源项目 coding-with-beat:值得放进 AI 部署工具箱吗?
|
|
6
|
21
|
2026 年5 月 27 日
|
|
新开源项目 adhd:值得放进 AI 部署工具箱吗?
|
|
5
|
25
|
2026 年5 月 26 日
|
|
Prompt caching 真能省下推理费吗?开源模型部署里更难的是命中率
|
|
5
|
18
|
2026 年5 月 26 日
|
|
AI 编程工具越用越贵?先把项目规则从长 prompt 里拆出来
|
|
8
|
22
|
2026 年5 月 26 日
|
|
无服务器 AI API 网关开始变实用:ai-relay 这种小项目适合先当备用路由
|
|
8
|
27
|
2026 年5 月 26 日
|
|
Ai 写代码越快越好吗?慢一点反而更适合生产改造
|
|
6
|
23
|
2026 年5 月 26 日
|
|
2-bit KV Cache 开始进入视野:长上下文推理省钱,可能不只靠换模型
|
|
5
|
18
|
2026 年5 月 26 日
|
|
从部署角度看:新开源 AI 项目 awesome-architecture:适不适合放进本地部署工具箱?
|
|
6
|
26
|
2026 年5 月 26 日
|
|
从 llm-d 到 NIM:大模型推理上生产,开始拼调度、缓存和显存账了
|
|
7
|
18
|
2026 年5 月 26 日
|
|
新开源 AI 项目 awesome-architecture:能不能进入本地部署清单?
|
|
0
|
14
|
2026 年5 月 26 日
|
|
这个新 AI 开源项目 awesome-architecture:适不适合放进本地部署工具箱?
|
|
0
|
8
|
2026 年5 月 26 日
|
|
新开源 AI 项目 awesome-architecture:适不适合放进本地部署工具箱?
|
|
0
|
10
|
2026 年5 月 26 日
|
|
llm-d 这类推理栈开始冒头:LLM 上生产,麻烦点可能不在模型本身
|
|
6
|
20
|
2026 年5 月 25 日
|
|
Prompt Caching 开始下沉到开源 LLM:推理成本可能比换模型更值得先算
|
|
10
|
14
|
2026 年5 月 26 日
|
|
DeepSeek V4 预览版传出后,部署侧最该盯的是长上下文还是单位成本?
|
|
7
|
17
|
2026 年5 月 26 日
|
|
从部署角度看:ai-fomo-skills 这类 AI 工具火起来后,本地算力该怎么接?
|
|
5
|
23
|
2026 年5 月 25 日
|
|
Langfuse 这类 LLM 可观测工具,可能比模型切换更先决定 Agent 成本
|
|
9
|
27
|
2026 年5 月 25 日
|
|
Ettin Reranker 值得看:RAG 排序模型可能到了该“专门小型化”的时候
|
|
7
|
16
|
2026 年5 月 25 日
|