最近 GitHub 上出现了一个值得关注的项目:sums001/Deepseek-API。它把 DeepSeek 的免费聊天网页逆向成了一组兼容 OpenAI 接口的本地代理。通俗点说,你可以用标准的 OpenAI SDK 直接调 DeepSeek V4 和 R1,推理费为零。
(配图:DeepSeek 聊天界面转 API 的架构示意,本地代理作为中间层衔接用户代码与聊天服务)
原理不复杂:项目在你本地启动一个小型 HTTP 代理,拦截发往 DeepSeek 聊天系统的请求,重新封装成 OpenAI 格式返回。你的代码只需要改一下 base_url 指向 localhost:xxxx,原来跑 GPT-4o 或 Claude 的 pipeline 就能直接切到 DeepSeek 模型。
真正值得讨论的不是能不能跑通,而是这笔账怎么算。
明面上的好处很直接:推理免费意味着你可以用 V4 的千亿参数做大规模批量评估、跑 A/B 对比实验、做回归验证集,而不需要盯着 API 账单或者 GPU 利用率曲线。对早期阶段的个人开发者和研究团队来说,这是以前只有大厂预算才能支撑的研发自由度。
但免费从来不是没有代价的。
第一是稳定性。DeepSeek 的聊天界面本身有频率控制、对话长度上限、以及账号层面的风控。本地代理能绕开部分限制,但如果被检测到非正常使用模式,账号会被限甚至封禁。你需要准备多账号轮换,任何面向生产环境的依赖都要承担这个运维成本。
第二是延迟。聊天界面从设计上就不是为 API 服务的——没有批处理端点、没有专用推理实例、没有优先级队列。高并发时你的请求得排队,响应时间可能从秒级掉到分钟级。
第三是 upstream 变更风险。DeepSeek 随时可以改聊天接口、调安全策略、换前端交互方式。一旦上游变了,本地代理就要跟着更新。这不是一个可以用作稳定生产依赖的东西。
我自己的看法:这种工具有它清楚的位置。原型验证和批量评估是绝佳用例——你有几万条测试数据要做模型回归,用逆向通道跑一遍,成本为零,出了偏差重跑就是。等你确认方案可行、指标达标了,再切到正式 API 或者自建推理,那时候你已经用免费通道把不确定性都扫清了。
这是逆向工程类项目的一个共同模式:从 windows-copilot-api 到各种 chat-to-api,都是在正式服务定价过高或者接口不开放的时候,给早期探索者一张低成本入场券。
(来源:github.com/sums001/Deepseek-API,HN 讨论页面 news.ycombinator.com)