近日,深度求索公司推出了其最新版本的DeepSeek-V3-0324模型。该模型在参数规模上实现了小幅提升,达到了6850亿,较前一代V3版本的6710亿有所增长。此次更新还伴随着系统性能的优化,并新增了多项实用功能。
深度求索继续坚持其开源战略,在本次更新中将DeepSeek-V3模型的开源协议调整为与DeepSeek-R1相同的MIT协议。这一协议允许开发者进行模型蒸馏和商业应用,进一步提升了技术生态的开放性。
在性能方面,新版本的最大亮点在于编程能力的显著提升,特别是在前端代码生成领域展现出了更强的能力。经过用户测试,在网站开发、UI设计等方面的表现尤为突出,仅需简单的文本提示即可快速完成多种网站或应用程序的设计与开发。
图为网友使用新版DeepSeek-V3设计的天气页面示例
(左图由新版DeepSeek-V3生成;右图由初代版本生成)
图为网友用V3新版本设计的个人网站界面
图为网友使用V3新版本开发的小型游戏
在实际应用中,新版DeepSeek-V3表现出色。多个测试表明,在网站开发和UI设计方面,其表现可与全球顶尖的闭源模型如Claude 3.7 Sonnet相媲美。
图为DeepSeek V3生成示例
图为Claude Sonnet 3.7生成对比示例
深度求索初代模型自发布以来便以性价比高著称。在与Qwen2.5-72 B、Llama-3.1-405 B等开源模型的基准测试中,其表现尤为出色,并且在性能上可比肩GPT-4和Claude-3.5-Sonnet等顶尖闭源模型。
据幻方量化此前发布的论文显示,该模型的训练成本极为低廉。假设H800 GPU的使用费用为每块2美元/小时,在最优算法、框架和硬件配置协同下,DeepSeek-V3的总训练成本仅为约557.6万美元(注:此费用仅涵盖正式训练阶段的成本,不包括前期研究和消融实验等支出)。
在服务定价方面,深度求索提供了极具竞争力的选择。其API调用价格为0.02美元/10亿Tokens,相比同类产品具有显著优势,充分体现了"高性价比"的市场定位策略。