把 DeepSeek 聊天变成 API:零成本推理的真正用途与隐形代价

最近 GitHub 上出现了一个值得关注的项目:sums001/Deepseek-API。它把 DeepSeek 的免费聊天网页逆向成了一组兼容 OpenAI 接口的本地代理。通俗点说,你可以用标准的 OpenAI SDK 直接调 DeepSeek V4 和 R1,推理费为零。

(配图:DeepSeek 聊天界面转 API 的架构示意,本地代理作为中间层衔接用户代码与聊天服务)

原理不复杂:项目在你本地启动一个小型 HTTP 代理,拦截发往 DeepSeek 聊天系统的请求,重新封装成 OpenAI 格式返回。你的代码只需要改一下 base_url 指向 localhost:xxxx,原来跑 GPT-4o 或 Claude 的 pipeline 就能直接切到 DeepSeek 模型。

真正值得讨论的不是能不能跑通,而是这笔账怎么算。

明面上的好处很直接:推理免费意味着你可以用 V4 的千亿参数做大规模批量评估、跑 A/B 对比实验、做回归验证集,而不需要盯着 API 账单或者 GPU 利用率曲线。对早期阶段的个人开发者和研究团队来说,这是以前只有大厂预算才能支撑的研发自由度。

但免费从来不是没有代价的。

第一是稳定性。DeepSeek 的聊天界面本身有频率控制、对话长度上限、以及账号层面的风控。本地代理能绕开部分限制,但如果被检测到非正常使用模式,账号会被限甚至封禁。你需要准备多账号轮换,任何面向生产环境的依赖都要承担这个运维成本。

第二是延迟。聊天界面从设计上就不是为 API 服务的——没有批处理端点、没有专用推理实例、没有优先级队列。高并发时你的请求得排队,响应时间可能从秒级掉到分钟级。

第三是 upstream 变更风险。DeepSeek 随时可以改聊天接口、调安全策略、换前端交互方式。一旦上游变了,本地代理就要跟着更新。这不是一个可以用作稳定生产依赖的东西。

我自己的看法:这种工具有它清楚的位置。原型验证和批量评估是绝佳用例——你有几万条测试数据要做模型回归,用逆向通道跑一遍,成本为零,出了偏差重跑就是。等你确认方案可行、指标达标了,再切到正式 API 或者自建推理,那时候你已经用免费通道把不确定性都扫清了。

这是逆向工程类项目的一个共同模式:从 windows-copilot-api 到各种 chat-to-api,都是在正式服务定价过高或者接口不开放的时候,给早期探索者一张低成本入场券。

(来源:github.com/sums001/Deepseek-API,HN 讨论页面 news.ycombinator.com

我觉得这类项目的真正价值不是省那点推理费,而是让开发者能提前评估模型能力再做采购决定。用免费通道跑完评估,知道型号合不合适再决定要不要上正式 API。

延迟是个硬伤。我简单测了一下,单请求大概 2-3 秒,一旦同时跑几个请求就开始排队了。当批量离线跑还行,在线服务和 API 没法比。

还有个角度:这个代理可以作为测试桩来用。你的代码先连逆向通道调通逻辑、验证输出格式,确认没问题了再切到正式推理服务。类似开发环境 mock 的思路。

对个人开发者来说最有价值的是批量评估场景。几万条数据跑一遍逆向通道,成本为零,出错了重跑也不心疼。上线再切正式 API 就行。

老项目的模式了。从 windows-copilot-api 到各种 chat-to-api,都是在正式接口不够开放的时候提供一个低成本接入点。当工具用可以,当依赖要谨慎。

补充一下:多账号轮换可以用浏览器自动化脚本批量注册,频率控制在每账号每天几十次请求比较安全。跑多了会被风控。

有一个问题很多人没提:如果 DeepSeek 改了聊天前端,这个代理就得跟着适配。这不是一次配置永久有效的东西,得有人维护。