豆包大模型能力与GPT-4o对齐！人工智能应用时代已经到来，探索字节人工智能产业链的投资价值

来源：华泰瑞思

核心观点

大豆包模型家族全新升级，新发视觉理解模型成为最大亮点

12月18日，火山发动机召开FORCE原动力大会，升级豆包家族系列大模型，包括:新发布的视觉理解模型和3D生成模型，升级豆包通用模型Pro(GPT-4o)、视频生成模型(动态海报)、音乐模型(生成3分钟作品，创作复杂音乐)、文生图模型（一键P图/海报）。其中，视觉理解模型已成为最大的亮点，可以同时输入文本和图像的相关问题。该模型可以全面理解并给出准确的答案。豆袋大型模型的日平均tokens调用量已超过4万亿，比5月份发布时增长了33倍以上。我们认为，豆袋模型和相应的人工智能应用程序正在迅速渗透，预计人工智能授权B/C端时代将加速。

豆袋视觉理解模型具有突出的跨模态能力，预计低价推广将解锁更多的价值场景

豆袋视觉理解模型显示出卓越的视觉理解和跨模态能力：1）更强的内容识别。能够识别物体的类别、形状、纹理等，了解物体之间的关系和空间布局；2）更强的理解和推理能力。根据识别的内容进行复杂的逻辑计算，如解决问题；3）更详细的视觉描述。视觉理解模型的输入定价为每千个标记 0.03元比行业平均价格低85%。我们认为，视觉理解模型可以扩大豆袋大模型的场景边界，扩大教育、旅游、电子商务、金融、医疗、物流等领域。较低的模型定价有望加快应用场景的推广，提高字节人工智能应用产品的用户粘性。

升级后，豆包通用模型pro全面对标GPT-4o，价格仅为后者的1/8

升级后的豆包通用模型pro能力大大提高:综合任务处理能力提高32%，与GPT-4o持平；指令遵循能力提高9%；代码能力提高了58%；专业知识领域提高54%，略领先GPT-4o；逻辑推理提高了13%；数学显著提高了43%。综合能力与GPT-4o完全对齐，使用价格仅为GPT-4o的1/8。我们认为，豆包Pro将进一步推动企业人工智能升级，以更强的模型效果和更低的推理成本提升C端用户体验和使用。

企业产品：火山方舟、纽扣、HiAgent，帮助构建AI能力中心

1)火山方舟提供全栈MaaS能力，支持模型精调、推理、评价等全方位功能，丰富插件，扩展API和高代码解决方案，升级缓存和记忆加工加载技术，加强人工智能搜索和推荐。2)纽扣是中国最具活力的智能身体开发社区，拥有100多万活跃开发者，创建了200多万智能身体应用程序。1.5版本推出，支持小程序和H5发布、API等应用形式增强了多模态能力，可以与各种硬件集成。3)Hiagent支持企业的私人部署和混合部署模式，沉淀100多个行业的应用模板，提高知识整合效果，帮助企业建立人工智能知识助手。

人工智能应用时代已经到来，探索字节人工智能产业链的投资价值

从C端AI应用来看，字节本身推出的AI APP应用相对闭环生态；AI智能硬件字节已推出AI智能耳机OLA friend，人工智能玩具显眼袋（尚未正式销售）、后续人工智能眼镜、人工智能机器人等值得期待。从B端人工智能合作的角度来看，我们整理了产业链的相关目标。详见研究报告原文。

风险提示：人工智能开发低于预期，用户响应低于预期，政策监管风险。本研究报告涉及未上市公司或未覆盖股票的内容，是对其客观公共信息的整理，并不意味着研究团队对公司和股票的推荐或覆盖。