排版/Annalee
火山引擎,又有大动作了。
2025年6月11日,火山引擎Force原动力大会揭晓了豆包大模型1.6版本、视频生成模型Seedance 1.0 pro等重量级新品,同时,也推出了经过升级的一站式AI云原生全栈服务。
梁汝波,字节跳动的CEO,对此发表看法称,确保火山引擎的出色表现对于字节跳动成为一家卓越的科技公司、维持技术领先地位至关重要。展望未来,字节跳动将毫不犹豫地持续加大投入,致力于实现智能技术的突破,并服务于产业应用领域。借助火山引擎,公司将持续向企业客户开放最新的模型和技术。
这意味着,火山引擎成为字节跳动AI的关键抓手。
目前,智能体已成为AI实现商业化的快捷途径,火山引擎凭借其“卓越性能、低廉成本、完善配套”的策略,为企业发展智能体提供了强大支持。
毋庸置疑,火山引擎对企业更友好。
性能更强,跻身国际第一梯队
大模型落地,进入智能体时刻。
谭待,火山引擎的总裁,指出:“若将时间维度拉长,技术体系全面铺开,我们实际上正经历着从PC时代过渡至移动时代,再到AI时代的演变。在这三个不同的时代中,技术的核心主体经历了转变,PC时代以Web技术为主,移动时代以APP技术为主,而AI时代则以Agent技术为主。”
Agent就是智能体,AI应用的最主流形态。
简单来说,随着AI在各行各业得到广泛应用,成为普遍认知,企业若要跟上时代潮流,采用大型模型已非选择,而是必须之举。智能体因其操作简便、入门容易的特点,正成为市场的新宠。
值得注意的是,智能体的战斗力与其所依托的大模型的性能之间存在着密切的联系。
恰逢其时,豆包的大模型虽然进入市场的时间略显滞后,却演绎了一出后来居上的精彩好戏,成功跻身为大模型领域当之无愧的强劲“黑马”。
至2025年5月底,火山引擎的tokens日均调用次数已攀升至16.4万亿,这一数字相较于2024年5月产品发布之初增长了137倍。
尤为关键的是,豆包大模型1.6系列正式亮相,在GPQA Diamond、AIME25、MultiChallenge等多个权威评测集合中,其得分均位居国际领先行列,这为企业发展智能体技术提供了丰富的选择。
豆包1.6是一款集多种功能于一体的综合模型,它在我国首次实现了对256K上下文内容的思考处理,并拥有自我调整思考水平的特性。该模型能够根据提示词的难易程度自动选择是否启动深度思考模式,既有效提升了效果,又显著降低了tokens的消耗。
豆包1.6的“thinking”版本是深度思考的强化型,它在代码编写、数学运算、逻辑分析等基本技能方面实现了显著提升,并能够支持构建结构复杂的智能实体;而“flash”版本则是极速型的,其响应延迟极低,TOPT仅需10毫秒,非常适合用于智能客服、语音助手等需要实时交互的应用场景。
事实上,豆包的硬实力,在高考数学成绩上表现得淋漓尽致。
进行2025年高考数学真题测试,豆包大模型取得了144分的高分,荣登国内模型排行榜首位;同时,在北京市海淀区的文理科高考模拟试卷中,成绩均超过了700分,其中理科成绩更是较2024年增长了154分,模型的进步速度令人赞叹不已。
一位互联网领域的分析专家向锌刻度透露:“在大型模型这一领域,企业需要具备雄厚的资金实力、健全的生态系统、先进的技术能力以及优秀的人才储备,遵循规模法则,强者才能持续保持优势。”
成本更低,打破传统定价惯例
性能更强之外,成本更低是智能体的另外一个重要诉求。
目前,智能体正在手机、汽车、教育以及金融等多个领域对生产力和生产关系进行重塑,而这同时也带来了成本不断攀升的挑战。
例如,2023年由斯坦福大学打造的一款虚拟现实世界中的西部小镇,配备了25个可供用户进行恋爱交友的虚拟角色,每个角色的运行费用达到了每小时20美元。
与之对应的是,智能体市场潜力无限。
《中国AI Agent应用市场概览(2025Q1)》的数据揭示,2024年,我国AI智能体市场总额成功跨越了50亿元的重要门槛,预计在接下来的四年里,该市场规模将保持超过60%的年复合增速,呈现出强劲的增长势头。
此背景下,企业亟须极具竞争力的低成本方案。
火山引擎精准定位问题核心,巧妙地在性能和成本之间寻找最理想的平衡,颠覆了行业固有的定价模式,从而助力智能体实现成本降低与效率提升。
一方面,抹去功能溢价。
深度思考与多模态功能的运用通常需额外费用,这在业界已是常态,然而豆包大模型1.6版本却与众不同,它原生具备深度思考和多模态能力,企业用户无需为获取token支付额外费用。
另外一方面,分区定价。
过去,出于简便省力的考虑,token的输入费用并未根据长度来设定,行业普遍实行统一的价格策略。然而,模型的成本却呈现出一种明显的增长趋势,具体表现为:随着输入上下文长度的提升,模型在处理token时的难度和成本也会相应地增加。
简而言之,存在分摊成本的现象。
目前,有超过八成的企业对调用的需求都集中在32K tokens以下,若对这一主要区域进行调度优化,无疑将大幅减少整体成本。谭待这样表达了他的观点。
豆包大模型1.6能够精确地对应企业的需求分布,它将定价区间细分为三个档次:0至32K字符、32K至128K字符以及128K至256K字符。同时,随着输入长度的延长,价格也会相应地上升。
Seedance 1.0 pro模型定价仅为0.015元每千tokens,而且制作一条时长5秒、分辨率高达1080P的视频仅需3.67元,这一价格在业内堪称最低。
因此,火山引擎秉持“优质模型让每家企业都能负担得起”的信念得以传承,并依靠“高品质低价格”的策略,进一步赢得了企业的认可和青睐。
《中国公有云大模型服务市场格局分析,2025年一季度》报告揭示,2024年我国公有云大模型的总调用次数高达114.2万亿tokens。在这其中,火山引擎的市场份额达到了46.4%,高居榜首,其调用次数几乎等同于排名第二和第三的两者之和。
显而易见,火山引擎通过消除功能溢价和区域定价,踏上了技术与商业创新同步发展的降低成本道路,进而促进了行业的健康竞争。
谭待曾这样表达观点:“在企业级市场中,商业模式的构建需以可持续发展为基石,所有商品都必须实现盈利,不能依赖补贴来实现价格下调。若降价导致亏损,且亏损规模随着规模的扩大而增加,那么这种模式便不再合理。”
配套更全,企业实现开发平权
更低成本之外,火山引擎配套更全也尤为值得一提。
为了孕育数以千计的智能个体,并应对形形色色的现实问题,智能体的开发模式必然迎来革新,而调用中心的角色也将从传统的程序员手中过渡至大模型技术。
这要求,配套的开发工具不断降低开发难度,实现开发平权。
吴迪,火山引擎智能算法的负责人,强调指出:“为了打造高效率的智能代理,我们不仅需充分利用人工智能技术,并融合优质的应用,同时还要致力于人工智能本身,注重对底层技术的优化与革新。”
考虑到这一情况,火山引擎推出了全面的一体化服务,旨在助力企业快速搭建智能系统。
即推出了promptPilot、MCP Servers、TRAE等产品,同时发布了多款开源项目,构建了一个涵盖大模型开发全流程的工具集。
例如,promptPilot承担着“翻译”的角色,它协助开发者将不明确的愿望转化为具体的目标,即便开发者缺乏对专业大模型知识的深入了解,也不会对最终的实际效果造成影响。只要开发者对所在行业和具体应用场景具备一定的知识和判断能力,便可以达到预期效果。
换句话说,通过优化需求分析、问题构建以及结果输出这三个关键步骤,能够将prompt调试的效率提高至三倍,从而显著减少智能体开发所需的时间。
再以火山引擎的MCP Server为例,它与TRAE、方舟体验中心以及扣子等平台实现了互联互通,实现了云服务功能的深度融合,进而有效填补了智能体从理论构想到实际应用过程中存在的环节缺失问题。
因此,开发者能够利用MCP对火山引擎的云服务模块进行操控,轻松实现计算、网络以及存储等环境的搭建,从而加速将创意转化为成熟的产品。
在此基础上,火山引擎推出了AI云原生全栈服务,这一服务贯穿了开发、数据处理以及安全保障等关键环节,助力企业迅速实现智能化转型。
AgentKit、TrainingKit与ServingKit共同支持企业高效开展智能体服务、模型训练及推理任务;多模态数据湖与Data Agent帮助企业打造智能化、高效且经济的智能体数据架构;AICC密态计算技术及大模型应用防火墙则助力企业构建坚实的网络安全壁垒,有效抵御针对智能体的恶意攻击……
显而易见,火山引擎凭借其全流程开发能力、高性价比的基础设施以及安全可靠的服务,已经成为企业致力于打造智能体时的首选方案。
总体来看,凭借“性能卓越、成本节省、配套完善”的优势,火山引擎有效降低了企业进入智能体领域的门槛,未来还将助力智能体实现广泛的应用和普及。
那么,火山引擎在AI云市场的领先地位,更稳了。