|
Tokdiet 上手记:本地 Proxy 抓出 AI 编程的每 Token 开销
|
|
7
|
12
|
2026 年6 月 22 日
|
|
DeepSeek-V4 预览版实测:1.6T MoE 在华为昇腾上的部署成本与推理表现
|
|
7
|
23
|
2026 年6 月 22 日
|
|
Gpt-5.5 幻觉率是 glm-5.2 的 3 倍——模型部署的隐性质量成本
|
|
6
|
12
|
2026 年6 月 22 日
|
|
Cloudflare 推出临时 Agent 账号:AI 代码写完就能部署,不再需要注册流程
|
|
6
|
18
|
2026 年6 月 22 日
|
|
LiteLLM 三条漏洞链几乎覆盖 AI 网关全部权限层 — CVSS 9.9,建议立即升级
|
|
7
|
13
|
2026 年6 月 22 日
|
|
Sakana Fugu 实测:多模型编排如何用更少算力追平顶尖闭源模型
|
|
7
|
17
|
2026 年6 月 22 日
|
|
GLM-5.2 开源:百万 Token 上下文的部署门槛和思考成本怎么算?
|
|
8
|
32
|
2026 年6 月 22 日
|
|
一块 DGX Spark 同时跑俩 Qwen3 模型:vLLM 的内存分配数学
|
|
8
|
11
|
2026 年6 月 21 日
|
|
Foreman 上手记:给 AI 编程 Agent 套一层 CI 门控流水线
|
|
6
|
3
|
2026 年6 月 21 日
|
|
Batchwork:统一批处理 API 让 LLM 推理成本直降 50%
|
|
0
|
6
|
2026 年6 月 20 日
|
|
LiteLLM 网关权限绕过高危漏洞——AI 推理代理层的安全防线要重新审视
|
|
5
|
10
|
2026 年6 月 19 日
|
|
JetBrains 开源 Mellum2:12B MoE 编程模型的部署与性价比分析
|
|
0
|
8
|
2026 年6 月 18 日
|
|
Omnigent 开源实测:一个编排框架统一调度 Claude Code、Codex、Cursor 等编程 Agent
|
|
5
|
23
|
2026 年6 月 18 日
|
|
SpaceX 600 亿美元收购 Cursor:AI 编程的部署价值
|
|
7
|
11
|
2026 年6 月 18 日
|
|
从零写了个推理引擎:tessera 用 Triton/CUDA 手搓 Continuous Batching 和 Speculative Decoding
|
|
6
|
9
|
2026 年6 月 18 日
|
|
shadcn/improve 一周 5000 星:让贵模型做架构审计,便宜模型写代码
|
|
8
|
12
|
2026 年6 月 17 日
|
|
Ponytail 一周 27K 星:让 AI Agent 学着当个「懒资深工程师」
|
|
6
|
22
|
2026 年6 月 17 日
|
|
本地跑大模型终于不折腾了:Vicki Boykis 那篇 989 分 HN 帖,总结了哪些真正重要的变化
|
|
7
|
42
|
2026 年6 月 17 日
|
|
SpaceX 600 亿美元收购 Cursor:AI 编程工具的部署价值凭什么这么高
|
|
0
|
4
|
2026 年6 月 16 日
|
|
Cohere 开源 North Mini Code:30B MoE 编程模型只激活 3B 参数,本地推理部署门槛大降
|
|
8
|
20
|
2026 年6 月 16 日
|
|
Holo3.1 开源:本地 Computer Use Agent 部署指南
|
|
8
|
29
|
2026 年6 月 16 日
|
|
Apple Foundation Models 上架 Claude 平台:云+端部署的新变数
|
|
8
|
13
|
2026 年6 月 15 日
|
|
在家做 ai 编程,怎么省钱又够用?
|
|
7
|
44
|
2026 年6 月 15 日
|
|
Kimi K2.7-Code 开源:1T 参数模型的部署门槛和性价比分析
|
|
7
|
23
|
2026 年6 月 15 日
|
|
RTX 5080 + RTX 3090 本地推理实测:Qwen 3.6 27B Q8 跑出 80+ tok/s
|
|
5
|
49
|
2026 年6 月 14 日
|
|
Windows 11 把本地 AI 扩展到了 RTX 30 系列显卡上:6GB VRAM 就能跑,本地推理的门槛在降低
|
|
7
|
44
|
2026 年6 月 13 日
|
|
AI Agent 一天烧掉运营商 6500 美元 AWS 账单:自主 Agent 缺少预算管控的真实案例
|
|
9
|
16
|
2026 年6 月 12 日
|
|
MiMo Code 开源发布:用最强模型做架构审计,弱模型做执行
|
|
8
|
19
|
2026 年6 月 12 日
|
|
Fedora 基础设施遭遇 AI Agent 供应链攻击——部署流水线的信任模型需要重估
|
|
8
|
15
|
2026 年6 月 12 日
|
|
LightSeek 发布开源推理引擎 TokenSpeed,目标对标 TensorRT-LLM 性能
|
|
7
|
19
|
2026 年6 月 12 日
|