来源:华泰瑞思
核心观点
大豆包模型家族全新升级,新发视觉理解模型成为最大亮点
12月18日,火山发动机召开FORCE原动力大会,升级豆包家族系列大模型,包括:新发布的视觉理解模型和3D生成模型,升级豆包通用模型Pro(GPT-4o)、视频生成模型(动态海报)、音乐模型(生成3分钟作品,创作复杂音乐)、文生图模型(一键P图/海报)。其中,视觉理解模型已成为最大的亮点,可以同时输入文本和图像的相关问题。该模型可以全面理解并给出准确的答案。豆袋大型模型的日平均tokens调用量已超过4万亿,比5月份发布时增长了33倍以上。我们认为,豆袋模型和相应的人工智能应用程序正在迅速渗透,预计人工智能授权B/C端时代将加速。
豆袋视觉理解模型具有突出的跨模态能力,预计低价推广将解锁更多的价值场景
豆袋视觉理解模型显示出卓越的视觉理解和跨模态能力:1)更强的内容识别。能够识别物体的类别、形状、纹理等,了解物体之间的关系和空间布局;2)更强的理解和推理能力。根据识别的内容进行复杂的逻辑计算,如解决问题;3)更详细的视觉描述。视觉理解模型的输入定价为每千个标记 0.03元比行业平均价格低85%。我们认为,视觉理解模型可以扩大豆袋大模型的场景边界,扩大教育、旅游、电子商务、金融、医疗、物流等领域。较低的模型定价有望加快应用场景的推广,提高字节人工智能应用产品的用户粘性。
升级后,豆包通用模型pro全面对标GPT-4o,价格仅为后者的1/8
升级后的豆包通用模型pro能力大大提高:综合任务处理能力提高32%,与GPT-4o持平;指令遵循能力提高9%;代码能力提高了58%;专业知识领域提高54%,略领先GPT-4o;逻辑推理提高了13%;数学显著提高了43%。综合能力与GPT-4o完全对齐,使用价格仅为GPT-4o的1/8。我们认为,豆包Pro将进一步推动企业人工智能升级,以更强的模型效果和更低的推理成本提升C端用户体验和使用。
企业产品:火山方舟、纽扣、HiAgent,帮助构建AI能力中心
1)火山方舟提供全栈MaaS能力,支持模型精调、推理、评价等全方位功能,丰富插件,扩展API和高代码解决方案,升级缓存和记忆加工加载技术,加强人工智能搜索和推荐。2)纽扣是中国最具活力的智能身体开发社区,拥有100多万活跃开发者,创建了200多万智能身体应用程序。1.5版本推出,支持小程序和H5发布、API等应用形式增强了多模态能力,可以与各种硬件集成。3)Hiagent支持企业的私人部署和混合部署模式,沉淀100多个行业的应用模板,提高知识整合效果,帮助企业建立人工智能知识助手。
人工智能应用时代已经到来,探索字节人工智能产业链的投资价值
从C端AI应用来看,字节本身推出的AI APP应用相对闭环生态;AI智能硬件字节已推出AI智能耳机OLA friend,人工智能玩具显眼袋(尚未正式销售)、后续人工智能眼镜、人工智能机器人等值得期待。从B端人工智能合作的角度来看,我们整理了产业链的相关目标。详见研究报告原文。
风险提示:人工智能开发低于预期,用户响应低于预期,政策监管风险。本研究报告涉及未上市公司或未覆盖股票的内容,是对其客观公共信息的整理,并不意味着研究团队对公司和股票的推荐或覆盖。
相关研报
研报: 2024年12月19日,豆包大模型能力与GPT-4o对齐,新视觉理解模型
(来源金融界)