字节跳动正式发布豆包视觉理解模型：1元可处理近300张高清图

百科 2024-12-28 03:02:44 5534

12月18日消息，字节正式在今天举办的跳动图火山引擎Force大会上，字节跳动正式发布豆包视觉理解模型，发布为企业提供极具性价比的豆包多模态大模型能力。

豆包视觉理解模型千tokens输入价格仅为3厘，视觉一元钱就可处理284张720P的理解图片，比行业价格便宜85％，模型以更低成本推动AI技术普惠和应用发展。处理

火山引擎总裁谭待介绍，近张豆包视觉理解模型不仅能精准识别视觉内容，高清还具备出色的字节正式理解和推理能力，可根据图像信息进行复杂的跳动图逻辑计算，完成分析图表、发布处理代码、豆包解答学科问题等任务。视觉

此前，豆包视觉理解模型已经接入豆包App和PC端产品。

值得一提的是，字节跳动还将在2025年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版，豆包端到端实时语音模型也将很快上线

目前，豆包大模型已经与八成主流汽车品牌合作，并接入到多家手机、PC等智能终端，覆盖终端设备约3亿台，来自智能终端的豆包大模型调用量在半年时间内增长100倍。

本文仅代表作者观点，不代表本站立场。
本文系作者授权发表，未经许可，不得转载。

马斯克76岁母亲在中国火了：自称几乎每个月都要来

9岁女孩长期吃头发胃里取出大块头发团：胃酸无法分解

[流言板]延续状态！哈登突破上篮打进，随后撤步3分造成格兰姆斯犯规

最后一把4am命都不要了起来猛抽t1

“能在顶峰相见很不容易” 朱婷、李盈莹获最佳主攻奖

关于篮球情杰这个博主

微信多人通话大升级直接拉人不用拉废群了

[流言板]热火伤病报告：巴特勒出战成疑，理查德森缺席