实际上,制作此类视频并非难事,该网友已公开了整个操作步骤,甚至连提示语都一一整理完备。
他首先运用Midjourney和Kling 2.1技术分别制作了图像与视频,接着利用Joystick png软件在画面中加入了按钮、小地图等HUD元素,并加入了ASMR音效,使得整体效果更加生动活泼。
接下来,我们就拿国产 AI 复刻一下。
第一步:生成图片。
在先前的评测文章《实测完即梦3.0,我悔不当初选了设计专业……》里,我们对即梦3.0进行了挑战,让其与GPT-4o、Ideogram 3.0一较高下,结果它毫不逊色。与先前的版本相比,即梦3.0确实有了显著提升,不仅在色彩搭配和布局设计上颇具审美价值,而且在生成中英文字体方面也几乎能够一蹴而就,无需多次尝试。
这次我们再来试下即梦 3.0 的「文生图」功能。
以第一人称视角拍摄的游戏截图,我扮演着一位穿着略显宽松的白色T恤和膝盖长度蓝色短裤的年轻动漫主角。可见双手推开了一扇被阳光晒褪色的木门,前臂放在门框上。在满是灰尘的走廊镜子中,映出角色那带有风吹乱发的柔和吉卜力风格的面容。屋内是一间温馨的海滨小屋:透过蕾丝窗帘斜射进来的阳光,粉彩的墙壁上挂着水彩风格的海洋风景画,堆满贝壳的拥挤书架。前景是铺盖沙发上方的“E:休息”提示。背景是一张枯木桌上冒着热气的茶杯,打开的窗户透露出远处的灯塔和宫崎骏风格的蓬松云朵。柔和的绘画质感,轻微的鱼眼镜头,相同的抬头显示(角落的迷你地图、生命条)。
这是一张第一人称视角的游戏截图,画面中展现了一位穿着略大的白色T恤和膝盖长度的蓝色短裤的年轻动漫主角。画面中可见主角的手紧握方向盘,阳光下的手臂搭在车门上,后视镜映照出主角带着随风飘扬头发的柔和吉卜力风格的面容。主角驾驶着车辆穿梭在充满活力的沿海小镇,街道由鹅卵石铺成,沿途是带有花箱的粉彩房屋,远处可见灯塔。画面拥有柔和的绘画质感,米原康隆式的天空布满蓬松的云朵,轻微的鱼眼镜头效果,以及抬头显示器的元素,如角落的迷你地图和生命值条。
这是一段以第一人称视角拍摄的电子游戏截图,画面中展示了一位穿着宽松白色T恤和褪色的牛仔短裤的年轻主角。他手持一个编织篮子,脚踩运动鞋,踏在湿润的鹅卵石上。他正穿梭于一个混乱的吉卜力风格街头市场:狭窄的摊位上售卖着发光的蘑菇、飘浮的灯笼以及螺旋切开的果实。鱼贩高声叫卖。柔和的绘画风格照明,景深效果,微妙的用户界面(角落中的小地图、生命条)。吉卜力工作室与《侠盗猎车手》的完美融合。[id_1612242640]
这是一段以第一人称视角拍摄的游戏截图,画面中,我扮演着一位年轻的动漫主角,身穿一件略显宽松的白色T恤(袖口有盐渍),下搭蓝色短裤至膝盖处,手中紧握着一把竹制钓竿。黄昏时分,我跪在一座长满苔藓的码头桥上,双臂搭在膝盖上。前景是“E:收线”的提示,钓线被拉得紧绷。背景是柔和色调的渔船,远处是 Miyazaki 风格的蓬松云朵下的灯塔。一条金鱼在翠绿的水面上跃出水面,一群鱼儿在清澈见底的水中优雅游动。画面具有一致的柔和绘画质感,鱼眼镜头效果,以及抬头显示设备(位于角落的迷你地图、生命值条)。)
第二步:生成视频。
谷歌Veo 3的推出激发了国内AI视频生成模型的竞争热潮。
5月29日,可灵2.1版本正式与用户见面;紧接着,6月11日,字节跳动公司发布了视频生成模型Seedance 1.0 pro,亦即即梦视频3.0 Pro版本;而就在昨日凌晨,Minimax公司也推出了其最新的视频生成模型Hailuo 02。
而且,梦和可灵已经加入了AI音效的功能,用户只需在视频生成过程中点击相关按钮,即可自动添加3至4条音效。值得注意的是,Hailuo AI目前尚未提供此功能。
我们把这三个视频模型放在一起对比下,看看谁更能打。
那位黑发少年迈着步伐从乡村小屋走向大海,镜头以类似GTA风格的第三人称视角跟随他的身影,海风轻拂着白色的窗帘,阳光在远处的帆船上闪烁,将温馨的室内细节与开阔的海滨视野在宁静的天空下完美融合。
那位金发少年驾驶着一辆复古的蓝色敞篷车沿着海滨鹅卵石街道行驶,五彩缤纷的花朵装饰的建筑依次掠过,镜头紧随车辆,驶向阳光照耀的海平线,海风轻拂着他的发丝,在宁静的天空下,他的头发随风轻轻摇曳。
那位少年穿梭于熙熙攘攘的鹅卵石市场,手中提着装满橙子的篮子,四周色彩缤纷的摊位和飘动的遮阳篷勾勒出他的足迹,摄像机紧随其后,捕捉着他专注的步伐,穿过熙熙攘攘的人群,在摇曳的传统灯笼下前行。
一群鱼儿在清澈见底的水中优雅游动,阳光透过水面,珊瑚礁轻轻摇曳,镜头保持静止,营造出一片宁静的水下景象。
最后,我们来看看成品效果:
传统游戏开发往往耗时且费用高昂,尤其在打造高品质场景、美术资源和动画内容时,需投入大量人力与时间。以去年备受瞩目的3A级巨作《黑神话·悟空》为例,其每小时开发费用高达1500万元至2000万元,整个项目的保守估算成本已超过4亿元。
视频生成模型的持续进步为游戏行业带来了革命性的机遇,这些模型能够依据文本内容,甚至捕捉到玩家的对话模式、选择倾向以及操作习性,进而实时构建出与玩家个性相契合的剧情走向和视觉风格。
谷歌的GameNGen模型运用扩散模型与强化学习技术,成功在无引擎环境中进行帧序列的预测,并动态构建游戏画面;而GameGen-O则能根据玩家的选择实时生成剧情线。这一创新不仅革新了游戏开发的流程,同时也对玩家的游戏体验进行了全新的诠释。玩家们将摆脱开发者设定的固定剧情与地图的束缚,借助人工智能的辅助,踏入一个能够无限拓展、个性定制、真正意义上的“开放”世界。
除此之外,AI技术的应用也可能降低游戏开发的难度,激发更多独立开发者乃至非专业人士投身创作领域。以去年为例,初创企业BuildBox AI推出了Buildbox 4 Alpha版本的AI游戏引擎,用户只需输入关键词,便能为游戏增添资源和动画,这在一定程度上激发了创作潜能。展望未来,这种技术或许还能催生全新的商业模式。
自然,技术层面上的困难依然存在,实时内容的生产依赖于庞大的计算能力,而如何在保证内容质量与快速响应之间取得平衡,依旧是一个棘手的问题;谷歌的GameNGen模型仅能处理像1993年的《Doom》这样的简单游戏,并且由于只有3秒的历史记忆限制,复杂场景中常常会出现图像错误;此外,AI生成内容的版权归属以及虚拟角色的行为准则等问题,也亟待得到明确。
尽管存在诸多挑战,我们仍旧坚信AI与游戏结合的前景广阔。正如英伟达首席执行官黄仁勋所预见的,在接下来的5到10年内,我们或许能够见证AI全权打造的全新游戏问世。
参考链接:
在Reddit的midjourney板块,你可以找到一篇关于宫崎骏风格游戏指南的文章,该指南已被收录。
禁止对特定内容进行修改,确保原创性得到尊重,维护版权的严肃性。