发布信息

5月28日DeepSeek R1模型完成小版本试升级,开源且表现出色

作者:软荐小编      2025-05-30 09:03:43     61

5月28日,DeepSeek于官方交流群中宣布,其R1模型已成功完成小规模升级测试。用户们可以在官方网页、APP、小程序上进行深度思考功能的测试,而API接口及使用方式则维持不变。同时,DeepSeek还在开源社区Hugging Face上发布了R1模型的新版本(R1-0528)。

_更新迭代是什么意思_更新系统

一些用户对R1模型的新版本进行了实际测试,并且指出,Deepseek-R1-0528在LiveCodeBench这一竞赛级编程难度的基准测试中,其表现与OpenAI的o3模型几乎持平。

更新迭代是什么意思_更新系统_

City-data.com的创始人Lech Mazur在社交媒体上透露,Deepseek-R1-0528在Extended NYT Connections基准测试中的表现相较于之前的DeepSeek R1有了明显的提升,其得分从38.6增加到了49.8。在Thematic Generation基准测试中,Deepseek-R1-0528的表现超越了DeepSeek R1,其得分由1.80降至1.74,而在此项测试中,得分越低意味着表现越佳。基准测试Thematic Generation旨在评估不同大型模型从少量示例及反例中推断出特定“主题”(即类别或规则)的能力,并在包含误导性选项的集合中识别出最符合该主题的选项。

_更新系统_更新迭代是什么意思

春节期间,DeepSeek异常火爆。进入3月,DeepSeek V3模型进行了小幅度的更新。这次更新的V3模型,吸取了DeepSeek R1模型在训练阶段采用的强化学习策略,显著提升了其在推理任务上的执行能力,并在数学及代码相关的评测集中,实现了超越GPT-4.5的得分。在处理HTML等前端代码任务时,新版V3模型所输出的代码具有更高的可用性,并且其视觉效果更为赏心悦目,充满设计韵味。针对中文写作任务,新版V3模型在继承R1写作能力的基础上进行了优化,不仅提高了中长篇文本创作的质量,还增强了内容的丰富性和深度。

相关内容 查看全部