4月24日,DeppSeek(深度求索)宣布全新系列模型 DeepSeek-V4 的预览版本正式上线并同步开源,这款万众期待的模型终于露出真容。
DeppSee表示,kDeepSeek-V4实现了全球领先的长上下文能力,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先,并且相比于传统方法大幅降低了对计算和显存的需求。从现在开始,1M(一百万)上下文将是 DeepSeek 所有官方服务的标配。
事实上在此之前DeppSeek已经开始了多项灰度测试,多位用户在在春节期间就发现App 端和网页端上下文窗口长度从此前 V3.1 版本的 128K token直接拉到了1M(百万)token。
潮新闻记者在4月23日询问了DeepSeek网页段专家模式上下文窗口长度,模型回复“我的上下文窗口是1M tokens(约100 万token),足够一次性处理三本《三体》体量的长文本。”同时,知识截止日期也从此前的版本更新到了2025年5月在不联网的情况下已经能够准确回答2025年4月的新闻事件。不过,这个新版本目前仍然是一个纯文本模型,不支持视觉输入,也不具备多模态识别能力。
潮新闻记者4月23日的提问
据了解,本次上线的模型按大小分为deepseek-v4-pro和deepseek-v4-flash两个版本:在 Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本:deepseek-v4-pro和deepseek-v4-flash。
两个版本覆盖不同使用场景,DeepSeek-V4-Pro专为复杂逻辑、深度推理及高性能Agent场景打造。在Agentic Coding评测中达到开源最佳水平,交付质量接近顶尖闭源模型;在数学、STEM及竞赛代码测评中,展现出世界顶级推理性能。
DeepSeek-V4-Flash主打极致性价比与高吞吐效率,虽然世界知识储备略逊于Pro版,但在简单推理和Agent表现上与Pro版旗鼓相当,能提供更快捷、经济的API服务。
针对当前主流的Agent产品,DeepSeek-V4进行了重点适配优化。官方已对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流平台完成适配,在代码及文档生成等任务上表现显著提升。面向复杂Agent场景,V4-Pro与V4-Flash均支持思考模式,用户可通过参数调节思考强度。
与此同时,DeepSeek-V4模型已在Hugging Face与魔搭社区全面开源,技术报告同步披露。
即日起登录DeepSeek官网或官方App,即可与最新的 DeepSeek-V4 对话,探索 1M 超长上下文记忆的全新体验。DeepSeek的API服务也已同步更新,通过修改 model_name 为 deepseek-v4-pro 或 deepseek-v4-flash 即可调用。
值得注意的是,在公布本次模型上线的推文最后,DeepSeek官方以一段极富深意的文字收束全文:“不诱于誉,不恐于诽,率道而行,端然正己。感谢每一位用户的信任与支持,大家的肯定、建议和期许,是我们不竭探索、持续进步的动力,也让我们始终坚守初心,专注于不懈的创新。”
开头这句话出自《荀子·非十二子》,意为不为赞誉所诱惑,不为诽谤所恐惧,遵循正道行事,端正自身品行。在AI行业喧嚣与竞争交织的当下,联想到此前的AI抢人大战,DeepSeek留下这段话,或许一定程度上传递出团队的态度。

