发布信息

5月28日晚DeepSeek R1模型试升级,R2大模型传闻未证实

作者:软荐小编      2025-05-29 15:00:59     74

5月28日晚,DeepSeek再次传来大消息。

当天,DeepSeek官方对外公布,DeepSeek R1模型已经完成了小版本的升级测试,用户可以访问官方网站、应用程序、小程序进行测试体验(启动深度思考功能),同时API接口及使用方法保持原状不变。

深夜重磅!DeepSeek最新发布,首批“试用体验”出炉→__深夜重磅!DeepSeek最新发布,首批“试用体验”出炉→

然而,DeepSeek官方并未透露此次版本更新的具体细节。今年三月,DeepSeek对V3模型进行了小幅度的版本提升,同样是在官方交流群中先行公布,并随后发布了详细的更新信息。在此之前,关于R2大型模型的诸多传闻也浮出水面,例如“其参数规模被揭露高达惊人的1.2万亿,与上一代R1的6710亿参数相比,几乎翻了一番”。但截至目前,并未获得官方证实。

DeepSeek的此次更新恰好发生在英伟达公布最新财务报告的前几个小时。作为全球顶级的AI芯片生产商,英伟达的在1月份因为R1的推出而遭受了显著的下跌。

据中国基金报的报道,根据用户的反馈,DeepSeek在升级之后,其模型中的思维链(CoT)表现出了明显的不同。

_深夜重磅!DeepSeek最新发布,首批“试用体验”出炉→_深夜重磅!DeepSeek最新发布,首批“试用体验”出炉→

用户们也对更新后的版本进行了归纳,指出其中包含的几个显著优势:首先,它采用了与Google模型相似的深度推理方式;其次,在写作任务方面进行了优化,使得内容更加自然,格式也更加规范;再者,其推理风格独树一帜,既迅速又经过深思熟虑;最后,针对每个任务,用户可以有长达30至60分钟的深入思考时间。

深夜重磅!DeepSeek最新发布,首批“试用体验”出炉→_深夜重磅!DeepSeek最新发布,首批“试用体验”出炉→_

此外,根据财联社的报道,AIGC开放社区的消息透露,一些网友已经急不可耐地开始试用新版R1,经过在知名代码测试平台Live CodeBench的测试,其性能与OpenAI最新推出的o3模型的高端版本不相上下。同时,还有网友对新版R1的设计风格进行了检验,发现其与OpenAI的o3风格几乎一致。

券商中国报道指出,这标志着DeepSeek自3月底以来的又一重要举措。3月25日晚,DeepSeek官方账号正式对外发布,V3模型已成功进行小幅度更新,同时详细阐述了新版本DeepSeek-V3-0324在推理、前端开发、中文写作以及中文搜索等方面的性能改进。当时,根据海外权威的AI模型评估机构最新发布的排行榜,V3版本的新模型在非推理类模型中取得了最高分,这一成绩超越了xAI公司的Grok3以及OpenAI的GPT-4.5(preview)版本。

然而,自那时起,DeepSeek的受欢迎程度便开始减弱,其使用频率也相应减少,同时亦引起了诸多疑问。目前,业界关注的焦点仍旧是其R2模型的推出。至4月底,有消息传出,R2大模型的参数量已高达令人震惊的1.2万亿,这一数字相较于前代R1的6710亿参数,几乎增加了一倍。该数值与GPT-4Turbo和谷歌Gemini2.0Pro等国际顶级模型相仿。R2的动态激活参数高达780亿,但实际计算消耗却只占总参数的6.5%。这样的设计使得模型在维持高效率的同时,大幅削减了运行成本。尽管如此,种种迹象似乎仅是市场人士的猜测,截至目前,官方尚未对此进行确认,R2模型也尚未正式发布。观察Open AI的举措,我们发现其动作频繁,同时人工智能领域的大型模型之间的竞争态势依然保持活跃。

相关内容 查看全部