发布信息

谷歌最先进人工智能模型Gemini 2.5 Pro成功通关29年前电子游戏

作者:软荐小编      2025-05-04 10:01:38     122

5月4日,IT之家传来消息,谷歌最为先进的人工智能模型实现了重大突破,其成功通关了一款29年前的电子游戏

_29年经典游戏被攻克:谷歌Gemini 2.5 Pro成功通关《宝可梦蓝》_29年经典游戏被攻克:谷歌Gemini 2.5 Pro成功通关《宝可梦蓝》

谷歌首席执行官桑达尔・皮查伊兴奋地在X网站上宣布,Gemini 2.5 Pro刚刚完成了《宝可梦蓝》,他说“太精彩了!”

此次直播活动名为“Gemini Plays Pokemon”,它由一位30岁名叫Joel Z的软件工程师发起,这位工程师并非谷歌员工,据IT之家了解,尽管如此,谷歌高管们对这一尝试表示了支持。谷歌AI Studio的产品负责人洛根・基尔帕特里克(Logan Kilpatrick)上个月称,Gemini在完成《宝可梦》一事上有显着进展,它已获得第五个徽章,当前表现第二好的模型仅获三个徽章,且使用的是不同代理框架。皮查伊还开玩笑说道,他们正在开发API,这指的是人工宝可梦智能。

为什么会选择《宝可梦》呢?早在今年2月,Anthropic公司就曾着重指出其Claude AI模型在《宝可梦红》里的表现,还表示Claude的“深度思考和代理训练”让它在应对“更令人意想不到”的任务时更具优势,比如说玩经典游戏。但Claude好像还没有打通《宝可梦红》,这是不是意味着Gemini在游戏方面的表现更出色? Joel Z在他的Twitch页面上告知观众:“不要把这个当作衡量大型语言模型玩宝可梦能力的标准。”两者之间没办法进行直接比较,原因在于Gemini使用的工具与Claude不同,而且它们接收到的信息也不一样。

此外,两款AI模型玩游戏都要借助代理框架,这些框架给模型提供带有额外信息的游戏截图,模型能据此做决策,这可能涉及调用专业代理,然后按下与AI指令对应的按钮。

Joel Z承认,在帮助Gemini完成游戏时,他进行了一些“开发干预”,他强调这不是作弊,他的干预是为提升Gemini的整体决策和推理能力,他不会给出具体提示词,也不会为特定挑战(如月球山脉)提供攻略或直接指令。唯一接近这种情况的是,我告知Gemini,要与火箭队小兵对话两次才能得到升空钥匙,而这实际上是一个在《宝可梦黄》中已被修复的漏洞

他还表示,Gemini Plays Pokémon仍在积极地进行开发,其框架也在持续不断地演变。

相关内容 查看全部