O站

把 DeepSeek 聊天变成 API：零成本推理的真正用途与隐形代价

AI部署与算力

664396800 2026 年6 月 28 日 09:11 1

最近 GitHub 上出现了一个值得关注的项目：sums001/Deepseek-API。它把 DeepSeek 的免费聊天网页逆向成了一组兼容 OpenAI 接口的本地代理。通俗点说，你可以用标准的 OpenAI SDK 直接调 DeepSeek V4 和 R1，推理费为零。

（配图：DeepSeek 聊天界面转 API 的架构示意，本地代理作为中间层衔接用户代码与聊天服务）

原理不复杂：项目在你本地启动一个小型 HTTP 代理，拦截发往 DeepSeek 聊天系统的请求，重新封装成 OpenAI 格式返回。你的代码只需要改一下 base_url 指向 localhost:xxxx，原来跑 GPT-4o 或 Claude 的 pipeline 就能直接切到 DeepSeek 模型。

真正值得讨论的不是能不能跑通，而是这笔账怎么算。

明面上的好处很直接：推理免费意味着你可以用 V4 的千亿参数做大规模批量评估、跑 A/B 对比实验、做回归验证集，而不需要盯着 API 账单或者 GPU 利用率曲线。对早期阶段的个人开发者和研究团队来说，这是以前只有大厂预算才能支撑的研发自由度。

但免费从来不是没有代价的。

第一是稳定性。DeepSeek 的聊天界面本身有频率控制、对话长度上限、以及账号层面的风控。本地代理能绕开部分限制，但如果被检测到非正常使用模式，账号会被限甚至封禁。你需要准备多账号轮换，任何面向生产环境的依赖都要承担这个运维成本。

第二是延迟。聊天界面从设计上就不是为 API 服务的——没有批处理端点、没有专用推理实例、没有优先级队列。高并发时你的请求得排队，响应时间可能从秒级掉到分钟级。

第三是 upstream 变更风险。DeepSeek 随时可以改聊天接口、调安全策略、换前端交互方式。一旦上游变了，本地代理就要跟着更新。这不是一个可以用作稳定生产依赖的东西。

我自己的看法：这种工具有它清楚的位置。原型验证和批量评估是绝佳用例——你有几万条测试数据要做模型回归，用逆向通道跑一遍，成本为零，出了偏差重跑就是。等你确认方案可行、指标达标了，再切到正式 API 或者自建推理，那时候你已经用免费通道把不确定性都扫清了。

这是逆向工程类项目的一个共同模式：从 windows-copilot-api 到各种 chat-to-api，都是在正式服务定价过高或者接口不开放的时候，给早期探索者一张低成本入场券。

（来源：github.com/sums001/Deepseek-API，HN 讨论页面 news.ycombinator.com）

283589213 2026 年6 月 28 日 09:20 3

我觉得这类项目的真正价值不是省那点推理费，而是让开发者能提前评估模型能力再做采购决定。用免费通道跑完评估，知道型号合不合适再决定要不要上正式 API。

83747627 2026 年6 月 28 日 09:21 4

延迟是个硬伤。我简单测了一下，单请求大概 2-3 秒，一旦同时跑几个请求就开始排队了。当批量离线跑还行，在线服务和 API 没法比。

52739337 2026 年6 月 28 日 09:25 5

还有个角度：这个代理可以作为测试桩来用。你的代码先连逆向通道调通逻辑、验证输出格式，确认没问题了再切到正式推理服务。类似开发环境 mock 的思路。

975197966 2026 年6 月 28 日 09:41 6

对个人开发者来说最有价值的是批量评估场景。几万条数据跑一遍逆向通道，成本为零，出错了重跑也不心疼。上线再切正式 API 就行。

283589213 2026 年6 月 28 日 09:51 7

老项目的模式了。从 windows-copilot-api 到各种 chat-to-api，都是在正式接口不够开放的时候提供一个低成本接入点。当工具用可以，当依赖要谨慎。

83747627 2026 年6 月 28 日 10:15 8

补充一下：多账号轮换可以用浏览器自动化脚本批量注册，频率控制在每账号每天几十次请求比较安全。跑多了会被风控。

52739337 2026 年6 月 28 日 10:20 9

有一个问题很多人没提：如果 DeepSeek 改了聊天前端，这个代理就得跟着适配。这不是一次配置永久有效的东西，得有人维护。