发布信息

数字人罗永浩直播引惊叹!近7小时1300万人观看,GMV突破5500万元?

作者:软荐小编      2025-06-19 21:01:28     179

“老罗,你是在扮演AI吧?”

数字人罗永浩在直播间处变不惊地回应观众,“确实能喝!我已经连续600多个月都在享受这个乐趣,大家不都是孩子吗?下一个问题,请!”此言一出,立刻引发了用户的连连惊叹。

这代表着普通大众对数字人直播的真实体验,一些具体数据让这种体验显得尤为深刻——长达近七小时的直播,吸引了超过一千三百万人的观看,总交易额更是超过了五千五百万。

这场直播仿佛真人般逼真,其中蕴含的AI技术实力不容小觑:AI自动生成的直播脚本字数接近十万,互动频率是真人直播间的三倍之多,AI执行的动作高达八千三百余次,知识库被调用的次数更是达到了一万三千次。

AI大型模型的影响力正逐渐在众多生活领域显现。就在一个多月前,百度推出了其全新的文心大模型4.5 Turbo,该模型以仅是GPT4.5价格0.2%的性价比在业界引起了广泛关注;同时,在文本理解和文风创作方面,其模型功能通过老罗数字人直播这一活动,得到了更加生动和直观的展示。

这位600多月的幼儿、老罗与朱萧木的默契协作、导致老罗抬头时显露出皱纹的指令,都得益于文心4.5T技术提供的强大支持。而在8300个AI动作的背后,是百度在语言、语音、视觉等领域内的一系列模型协同运作的结果。

“应用正是大型模型的核心价值”,李彦宏曾屡次强调此观点。尽管百度尚未涉足通用视频生成模型的研发,然而,它以应用为核心、专注于场景的模型能力正在通过多样化的应用得到展现——在业界仍在探索AI应用落地模式的关键时期,百度已显著实现了“利用AI提升GMV”的目标。

四大突破,百度数字人再造一次购物节狂欢

今年618电商盛宴中,百度推出的罗永浩数字人直播首秀,成为行业中的一抹亮色,实为罕见的新奇现象。

实际上,最终的数据结果显现,这并非一场空中楼阁的技术试验。单场活动的最终成交额高达5500万元,远超预期;其中,部分3C、食品等关键品类商品的带货量甚至超过了罗永浩5月份的真人首秀同期数据,成功打破了数字人直播带货的新纪录。

今年四月,百度2025 Create大会上,李彦宏推出了极具说服力的数字人形象,引领数字人迈入3.0时代,标志着一项新的成就。这一代高说服力数字人,其形象、声音、动作均与真人高度一致,具备思考与决策能力,并能协同完成特定任务,成为超级智能体。

6月17日,百度AI DAY开放日之际,百度副总裁兼电商总经理平晓黎进行了分享。他透露,在构建高说服力数字人的基础上,百度电商此次推出了业界首创的超头主播罗永浩数字人,该数字人在体验、内容、视觉以及效果四个方面均取得了显著突破。

首先,我们推出了行业内首个采用双数字人进行互动的直播间,这一举措旨在增强营销效果和提升消费者端的体验。

二是依托于文心4.5T的版本升级,剧本模式使得数字人能够“理解创作之道”并展现出独特的“个性特征”。

第三点,成功打造了业界首个多模态深度整合的虚拟形象,确保了该虚拟形象能够长时间运行且保持稳定与可控。

四是攻克多任务复杂场景,数字人带货效果媲美真人。

图片

观众在直播间里目睹了,罗永浩与数字助播朱萧木默契配合,不时抛出笑料。他们不仅能够熟练地完成喝奶茶、提可乐等小动作,还能与观众通过弹幕进行即时的互动交流。

图片

直播过程中,AI共调用了1.3万次知识库,制作出了9.7万字的详细产品解说,同时,双数字人搭档也完成了超过8300个动作。

罗永浩数字人:基于文心大模型的最佳实践

在长达近7小时的直播带货活动中,支撑这一过程的正是百度所拥有的先进的大规模多模态模型技术。

数字人长时间展现出的稳定性和逼真度,并非单一模型所能完全解决。百度的数字人整体解决方案,以语言模型为核心动力,构建剧本,进而通过剧本来引导语音与视觉实现多模态的协作和动态交流。

在6月17日举行的AI DAY活动中,百度公司的执行副总裁吴甜全面阐述了多模态协同的数字人技术。

百度研发的多模态协同数字人技术,依托文心4.5T平台,成功实现了剧本的融合多模态规划和深度思考生成。该技术以剧本为驱动,促使数字人实现多模态协同,并实现动态决策的实时交互。这使得数字人的神情、形态、语音、容貌和对话达到了高度的统一。最终,展现出一个具有高度表现力、内容极具吸引力,且“人—物—场”可自由交互的超拟真数字人形象。

其中至关重要的步骤包括剧本制作技术,这一技术涵盖了台词创作、多模态驱动以及动态交互三个核心组成部分。

以罗永浩的数字人剧本为参照,该剧本由文心大模型4.5 Turbo所创造,充分体现了主播的独特风格,带有鲜明的“罗氏幽默”特点,同时还能实现两位主播之间的内容同步,动态地实现多样化的实时互动。依托文本自控的语音合成大模型,具备出色的语音合成效果,再结合直播中的台词和发音者的特点,能够合成出既得体又自然流畅的声音。

为了克服数字人直播中双人声音同步的难题,百度采用了对话上下文编码技术,通过将对话历史与当前对话内容进行语音合成的一体化推理计算,最终达到了流畅且自然的双人对话效果。

数字人形象的构建与控制技术,通过融合多种模态的视频解析、跨模态信号的生产以及视频生成等手段,成功突破了高可控性交互、高精度以及长时间内的一致性保持等挑战,最终达成了高度一致且超逼真的罗永浩数字人长视频制作。

百度作为我国率先投身于大模型研发的企业之一,在芯片、框架、模型和应用四个技术层面进行了全面布局,其在AI大模型领域的创新技术优势尤为突出。

今年伊始,百度接连推出了四款基座级大型模型,包括文心大模型4.5及4.5T版本,以及文心大模型X1和X1 Turbo。特别值得一提的是,文心4.5的价格仅为GPT的百分之一,而X1 Turbo在信通院的评测中荣获了最高评价。

近期,国际知名的市场调研与咨询公司IDC发布了《中国基础大模型产品综合评估报告(2025年版)》,在该报告中,文心大模型在八个关键评估指标上取得了七项满分的优异成绩,独占鳌头,成为此次评估中唯一实现七项指标均获满分的模型。

吴甜认为罗永浩的数字人项目是文心大模型应用的最佳典范。她强调,百度在大模型技术领域的不断深入研究和创新,将给用户带来更加卓越的体验,并为行业带来更多具有突破性的商业模式。

百度AI应用:不止落地,更揽实绩

2025年,广泛认可的观点是大型模型正在为各行各业提供助力。在618这个重要时刻,百度适时推出了罗永浩的数字人直播间,不仅成功达到了直播带货行业领先水平的GMV,这也表明了用户对数字人的接受程度已经得到了实际验证。

罗永浩,作为一位备受瞩目的主播,将在很大程度上起到示范效应,吸引众多超头主播纷纷加入,共同打造慧播星数字人矩阵。这一举措或将为中国直播电商领域带来一场新的竞争格局变革。

百度副总裁、电商总经理平晓黎

百度优选,作为百度的智能电商平台,已逐步推出搜索智能导购、商品对比、全网比价等多项新功能。目前,每日有超过2000万用户借助百度智能导购作出购买选择。据百度提供的数据,采用数字人直播的商家,其GMV平均增长了62%,同时直播运营成本降低了80%,实现了“降本增效”的双重突破。

罗永浩所属机构交个朋友的代表、公司副总裁吴加录认为,百度的AI技术、交个朋友的直播运营经验以及供应链资源三者之间达成了技术与应用场景的绝佳融合,这种“技术+IP”的协作模式亦将为行业智能化转型的探索提供宝贵的实践案例。

同时,百度电商推出了两项重要举措:“梦蝶计划”旨在通过流量支持、头部主播数字人塑造以及预算支持,使百度精选头部主播的数量实现大幅增长;“繁星计划”则计划额外增加十万位慧播星数字人,投入一亿元用于数字人消费补贴,并提供千万级运营支持,以助力更多普通人和中小企业开展数字人直播业务。这更进一步凸显了百度决心在电商领域深耕的决心。

百度大模型在多模态方面的综合实力得以在数字人身上展现。该数字人专注于特定领域,与通用视频生成模型相较,能更精确地调整模型,致力于提供极致的人机交互体验,拥有实时交互功能,技术要求相对不高,应用场景明确,且更易于构建可复制的商业模式。

数字人的成就,实质上是百度在AI应用领域再次投入的成果之一。百度创始人李彦宏在多个场合都曾着重指出,应用才是大型模型的核心价值。因此,无论是研发文心大模型,还是构建AI应用的基础设施——云平台,百度始终以应用需求为导向,致力于降低模型成本,并提升云平台的端到端性能。

可以预见到,大模型的应用范围不仅限于单一的APP产品,在融合了多模态技术之后,人工智能将展现出更为强大的功能。

今年,百度推出了无代码应用开发工具“秒哒”,使得任何人都能轻松开发应用。同时,AI代码助手“文心快码”已为760万开发者提供服务,为百度贡献了超过40%的新增代码。在视觉大模型的应用领域,百度加大了对无人驾驶技术的投入。今年,萝卜快跑项目加快了国际化步伐,在全球范围内累计提供了超过1100万次的服务。

行业陷入通用模型同质化竞争的困境时,百度早已迅速调整战略,将关注点聚焦于商业应用场景。它以满足各行业具体需求为起点,不断推动模型功能的升级和进步。这种“以应用为导向的模型”策略,使得人工智能技术能够率先转化为可衡量的商业成果(GMV),加速了AI行业从技术竞技向解决实际问题、创造实际商业价值的转变。(本文首发于钛媒体APP,作者|李程程)

想要获取更多精彩内容,请关注钛媒体的微信公众号(ID:taimeiti),亦或下载钛媒体应用程序。

相关内容 查看全部