分享

刷屏!国产大模型匹敌GPT-4o,重点关注三大主线

市场经济网
作者:纪伦
2024-12-31 2.2w

日前深度求索DeepSeek发布了其DeepSeek-V3模型。该模型是一款强大的混合专家(MoE)语言模型,拥有671B参数,激活37B。DeepSeek-V3在多项基准测试中表现优异,编程能力甚至媲美最领先的3.5 Sonnet,超过GPT-4o。

光大证券分析,短期来看,DeepSeek-V3的低训练预算可能会让市场对算力需求的增长预期有所下调,尤其是对高性能计算(HPC)和GPU等硬件供应商的需求可能受到一定影响。但长期而言,低训练预算并不意味着算力需求的减少,而是算力利用效率的提升。随着大模型技术的普及和应用的扩展,算力需求仍将保持增长,AI芯片、边缘计算等长期成长性无忧。

中信证券认为,DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。持续看好AI产业链的加速落地机遇,建议重点关注AI应用、AI Infra、AI算力三大主线。


(来源金融界)
关注 重点 匹敌 国产 模型
声明:市场经济网所刊载信息来源于网络,并不代表本站观点。本文所涉及的信息、数据和分析均来自公开渠道,如有任何不实之处、涉及版权问题,请联系我们及时处理。举报邮箱:scdzw_jubao@163.com