字节跳动正式发布豆包视觉理解模型:1元可处理近300张高清图
12月18日消息,字节正式在今天举办的跳动图火山引擎Force大会上,字节跳动正式发布豆包视觉理解模型,发布为企业提供极具性价比的豆包多模态大模型能力。
豆包视觉理解模型千tokens输入价格仅为3厘,视觉一元钱就可处理284张720P的理解图片,比行业价格便宜85%,模型以更低成本推动AI技术普惠和应用发展。处理
火山引擎总裁谭待介绍,近张豆包视觉理解模型不仅能精准识别视觉内容,高清还具备出色的字节正式理解和推理能力,可根据图像信息进行复杂的跳动图逻辑计算,完成分析图表、发布处理代码、豆包解答学科问题等任务。视觉
此前,豆包视觉理解模型已经接入豆包App和PC端产品。
值得一提的是,字节跳动还将在2025年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版,豆包端到端实时语音模型也将很快上线
目前,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。
本文地址:http://mdj6f.ahlulin.com/news/48c32899623.html
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。