|
欢迎来到 O站!:wave:
|
|
14
|
2128
|
2025 年3 月 22 日
|
|
Claude Sonnet 5 发布:性能指标翻倍,部署策略需要重新算这笔账
|
|
1
|
1
|
2026 年7 月 1 日
|
|
DSpark 开源:推理提速 85% 的背后是一次显存-计算协同调度革新
|
|
8
|
4
|
2026 年7 月 1 日
|
|
Claude Sonnet 5 定价 $2/百万 token:Anthropic 把性价比作为主打,部署侧该怎么算这笔账
|
|
6
|
2
|
2026 年6 月 30 日
|
|
DeepSeek 开源 DSpark:推理速度提升 60-85%,靠的是自推测解码
|
|
6
|
5
|
2026 年6 月 30 日
|
|
DeepSeek DSpark 开源:推理速度提升 60-85%,PyTorch 核心维护人也点赞
|
|
6
|
11
|
2026 年6 月 30 日
|
|
Qwen 3.6 27B 本地开发实测:28 GB 起、llama.cpp 一套跑通,效果已经接近旗舰模型
|
|
4
|
16
|
2026 年6 月 29 日
|
|
Aleph Alpha 把模型训练做成了代码流水线:Savanna 的部署启示
|
|
8
|
3
|
2026 年6 月 29 日
|
|
GPT-5.6 Sol 的政府审批门槛:部署决策中新增的合规成本维度
|
|
7
|
9
|
2026 年6 月 29 日
|
|
DeepSpec 全栈投机解码框架开源:DeepSeek 把推理加速的钥匙从推断端延伸到了训练端
|
|
5
|
5
|
2026 年6 月 29 日
|
|
把 DeepSeek 聊天变成 API:零成本推理的真正用途与隐形代价
|
|
8
|
17
|
2026 年6 月 29 日
|
|
Anthropic Mythos 出口管制催生亚洲替代模型——部署策略的多极时代
|
|
6
|
10
|
2026 年6 月 29 日
|
|
Workweave Router:50ms 内智能路由,推理成本直降 40-70%
|
|
0
|
6
|
2026 年6 月 27 日
|
|
Ornith-1.0:能自己学强化学习的编程模型,部署成本怎么算
|
|
6
|
21
|
2026 年6 月 26 日
|
|
vLLM 推理服务器一键部署:HF Jobs 新功能速览
|
|
0
|
7
|
2026 年6 月 25 日
|
|
Upbound Modelplane:开源 AI 推理控制平面如何改变集群管理方式
|
|
0
|
4
|
2026 年6 月 25 日
|
|
Glm-5.2 能跑在什么硬件上?一份实测参考
|
|
5
|
34
|
2026 年6 月 25 日
|
|
VibeThinker-3B 登上推理前线:3B 小模型怎么做到对标 DeepSeek V3.2 和 GLM-5
|
|
5
|
20
|
2026 年6 月 25 日
|
|
DFlash 让 Blackwell 推理提速 15x:块扩散投机解码到底怎么用
|
|
6
|
11
|
2026 年6 月 25 日
|
|
OpenAI 自研推理芯片 Jalapeño 发布:对 LLM 部署成本格局意味着什么
|
|
6
|
10
|
2026 年6 月 25 日
|
|
Baseten 融资 15 亿美元搭建推理云,AI 部署的成本结构正被改写
|
|
6
|
8
|
2026 年6 月 25 日
|
|
Windows Copilot 被逆向成了 OpenAI 兼容 API:免费用上 GPT-4/5 的可行性与风险
|
|
5
|
25
|
2026 年6 月 24 日
|
|
自建推理 vs API 调用:2026 年自托管 LLM 的真实账单
|
|
5
|
22
|
2026 年6 月 23 日
|
|
Apertus 完全开源基础模型:从权限到推理成本,主权 AI 到底意味着什么
|
|
5
|
9
|
2026 年6 月 22 日
|
|
Tokdiet 上手记:本地 Proxy 抓出 AI 编程的每 Token 开销
|
|
7
|
11
|
2026 年6 月 22 日
|
|
DeepSeek-V4 预览版实测:1.6T MoE 在华为昇腾上的部署成本与推理表现
|
|
7
|
21
|
2026 年6 月 22 日
|
|
Gpt-5.5 幻觉率是 glm-5.2 的 3 倍——模型部署的隐性质量成本
|
|
6
|
12
|
2026 年6 月 22 日
|
|
Cloudflare 推出临时 Agent 账号:AI 代码写完就能部署,不再需要注册流程
|
|
6
|
18
|
2026 年6 月 22 日
|
|
LiteLLM 三条漏洞链几乎覆盖 AI 网关全部权限层 — CVSS 9.9,建议立即升级
|
|
7
|
12
|
2026 年6 月 22 日
|
|
Sakana Fugu 实测:多模型编排如何用更少算力追平顶尖闭源模型
|
|
7
|
17
|
2026 年6 月 22 日
|