分享

豆包大模型能力与GPT-4o对齐!人工智能应用时代已经到来,探索字节人工智能产业链的投资价值

市场经济网
作者:纪伦
2024-12-21 0.57w

来源:华泰瑞思

核心观点

大豆包模型家族全新升级,新发视觉理解模型成为最大亮点

12月18日,火山发动机召开FORCE原动力大会,升级豆包家族系列大模型,包括:新发布的视觉理解模型和3D生成模型,升级豆包通用模型Pro(GPT-4o)、视频生成模型(动态海报)、音乐模型(生成3分钟作品,创作复杂音乐)、文生图模型(一键P图/海报)。其中,视觉理解模型已成为最大的亮点,可以同时输入文本和图像的相关问题。该模型可以全面理解并给出准确的答案。豆袋大型模型的日平均tokens调用量已超过4万亿,比5月份发布时增长了33倍以上。我们认为,豆袋模型和相应的人工智能应用程序正在迅速渗透,预计人工智能授权B/C端时代将加速。

豆袋视觉理解模型具有突出的跨模态能力,预计低价推广将解锁更多的价值场景

豆袋视觉理解模型显示出卓越的视觉理解和跨模态能力:1)更强的内容识别。能够识别物体的类别、形状、纹理等,了解物体之间的关系和空间布局;2)更强的理解和推理能力。根据识别的内容进行复杂的逻辑计算,如解决问题;3)更详细的视觉描述。视觉理解模型的输入定价为每千个标记 0.03元比行业平均价格低85%。我们认为,视觉理解模型可以扩大豆袋大模型的场景边界,扩大教育、旅游、电子商务、金融、医疗、物流等领域。较低的模型定价有望加快应用场景的推广,提高字节人工智能应用产品的用户粘性。

升级后,豆包通用模型pro全面对标GPT-4o,价格仅为后者的1/8

升级后的豆包通用模型pro能力大大提高:综合任务处理能力提高32%,与GPT-4o持平;指令遵循能力提高9%;代码能力提高了58%;专业知识领域提高54%,略领先GPT-4o;逻辑推理提高了13%;数学显著提高了43%。综合能力与GPT-4o完全对齐,使用价格仅为GPT-4o的1/8。我们认为,豆包Pro将进一步推动企业人工智能升级,以更强的模型效果和更低的推理成本提升C端用户体验和使用。

企业产品:火山方舟、纽扣、HiAgent,帮助构建AI能力中心

1)火山方舟提供全栈MaaS能力,支持模型精调、推理、评价等全方位功能,丰富插件,扩展API和高代码解决方案,升级缓存和记忆加工加载技术,加强人工智能搜索和推荐。2)纽扣是中国最具活力的智能身体开发社区,拥有100多万活跃开发者,创建了200多万智能身体应用程序。1.5版本推出,支持小程序和H5发布、API等应用形式增强了多模态能力,可以与各种硬件集成。3)Hiagent支持企业的私人部署和混合部署模式,沉淀100多个行业的应用模板,提高知识整合效果,帮助企业建立人工智能知识助手。

人工智能应用时代已经到来,探索字节人工智能产业链的投资价值

从C端AI应用来看,字节本身推出的AI APP应用相对闭环生态;AI智能硬件字节已推出AI智能耳机OLA friend,人工智能玩具显眼袋(尚未正式销售)、后续人工智能眼镜、人工智能机器人等值得期待。从B端人工智能合作的角度来看,我们整理了产业链的相关目标。详见研究报告原文。

风险提示:人工智能开发低于预期,用户响应低于预期,政策监管风险。本研究报告涉及未上市公司或未覆盖股票的内容,是对其客观公共信息的整理,并不意味着研究团队对公司和股票的推荐或覆盖。

相关研报

研报: 2024年12月19日,豆包大模型能力与GPT-4o对齐,新视觉理解模型


(来源金融界)
投资 价值 产业 能力 模型 时代
声明:市场经济网所刊载信息来源于网络,并不代表本站观点。本文所涉及的信息、数据和分析均来自公开渠道,如有任何不实之处、涉及版权问题,请联系我们及时处理。举报邮箱:scdzw_jubao@163.com