发布信息

Qwen3系列模型发布引全球AI圈震动,参数少表现优亮点足

作者:软荐小编      2025-05-25 21:01:14     140

树莓派中国源_崛起派生_

文 观察者网心智观察所

尽管DeepSeek-R2在五一假期并未如市场传闻般亮相,然而,Qwen3系列模型却已率先登场,为全球人工智能领域带来了显著的震动。

自4月29日问世以来,通义千问Qwen3不仅以其一连串耀眼的成绩单令人印象深刻,更在于其8B、4B、1.7B、0.6B等模型在开源领域所展现出的创新玩法,而当这款产品在旧款手机乃至树莓派上也能处理Token时,一种前所未有的想象空间似乎已经悄然开启。

树莓派中国源_崛起派生_

(海外极客在树莓派上成功部署了Qwen3)

参数更少,表现更优

DeepSeek-R1凭借其庞大的6710亿参数规模(其中激活参数高达370亿),在全球大模型领域独占鳌头。与此同时,外界开始关注到,中国学术界和工业界在单纯追求算力和模型规模之外,探索出了一条全新的发展路径。Qwen3的出现,无疑将这种具有中国特色的“炫技”风格推向了新的高度。

阿里云最新发布的Qwen3模型,以其高达235B的总参数量(其中激活参数达22B),在性能排行榜上交出了一份令人瞩目的成绩单。在多个业界权威基准测试中,包括AIME25(数学推理)、LiveCodeBench(代码能力)、BFCL(工具和函数调用能力)以及Arena-Hard(指令微调LLM基准)等方面,均实现了卓越的表现。这表明通义千问在规模上仅为DeepSeek-R1总参数量的三分之一,却实现了甚至超过了后者的性能水平。

树莓派中国源_崛起派生_

特别需要指出的是,Qwen3系列模型在与世界顶尖模型的较量中同样彰显了其卓越实力:在与Gemini 2.5 Pro的对比试验中,Qwen3-235B在多个基准测试中取得了与对方相当的成绩;在挑战性极强的数学推理测试(例如AIME)中,它甚至超越了OpenAI的o1和o3-mini等强劲对手;而在编程基准测试LiveCodeBench上,它同样展现出了相较于o3-mini的显著优势。

Qwen3的核心技术突破是什么?

答案源自其独创的“混合推理模型”结构,该结构将“思考模式”与“非思考模式”完美融合于一个模型之内。在进入思考模式时,模型将进行深入的推理,经过逐步的深思熟虑后提供答案,适用于解决复杂问题;转至非思考模式后,模型能够迅速作出反应,更适宜于处理简单问题。这种巧妙的设计使得用户能够依据任务的难度来调节模型“思考”的深度,从而在推理效果与计算资源消耗之间实现更加理想的平衡。

同时,阿里云在大型模型所需的计算资源和部署费用方面也取得了显著改进。Qwen3的部署费用大幅降低,仅需4张H20芯片即可完成满血版的部署,其成本大约是DeepSeek-R1的三分之一。而对于8B及以下规格的模型,其硬件需求已被证实可以相当宽松。这种成本上的优势无疑将赋予其更强大的商业化潜力,并扩大其应用范围的可能性。

中国AI,全球影响

DeepSeek-R1标志着我国AI领域的首次国际性重大进展,而Qwen3则是对这一成就的进一步深化与加强。我国大模型的发展正逐步构建起独特的技术路径和创新体系,同时,其与国际顶尖模型的竞争力也在逐步提升。

阿里云持续对外公开其Qwen3系列模型,这一举措的战略价值同样不容小觑。

Qwen3开源的内容不仅限于密集模型,还涵盖了混合专家(MoE)模型。这些模型包括0.6B、1.7B、4B、8B、14B、32B等不同规模的密集模型,以及30B-A3B和235B-A22B的MoE模型。值得一提的是,这在业界颇为少见。这些模型均遵循Apache 2.0许可协议进行开源,使得开发者能够更加灵活地运用这些模型于商业用途。

这种开源策略与国际巨头形成鲜明对比。

面对OpenAI和Anthropic等企业选择对顶级模型进行闭源处理的情况,我国大型模型制造商坚持开源策略,这不仅降低了技术进入的门槛,而且切实体现了推动人工智能普及的初衷。这一重要意义在全球范围内受到了广泛的认可与关注,正如TechCrunch的报道所证实的那样:中国研发的Qwen等模型系列的出现,已经给美国OpenAI等实验室所提供的先进AI技术带来了不小的挑战。

在DeepSeek-R1横空出世之前,Qwen模型家族已在开源大语言模型应用生态中占据了显著地位,其影响力遍及全球南方国家的小语种应用开发,以及众多细分研究领域的AI4S探索。Qwen早已成为了一个颇具知名度的国际品牌,吸引了全球范围内的超过3亿次下载。开发者已在Hugging Face平台上成功构建了超过十万种基于Qwen的派生模型,这一系列模型因而成为了全球范围内应用最广泛的开放源代码人工智能模型之一。这种生态规模的效应,正日益成为中国人工智能领域发展的强劲动力。

因此,Qwen3的问世,标志着我国AI企业凭借不断的技术革新和开源策略,在全球AI领域的竞争中取得了新的突破。

商业落地,依然漫漫

通义千问Qwen3在技术领域实现了显著进展,然而,将这一系列技术突破转化为实际商业价值,却遭遇了不少困难。正如阿里云首席技术官周靖人所说,"若不对基础模型进行优化调整,便难以直接满足业务需求"。在企业层面,大型模型还需克服个性化定制、成本效益分析以及安全合规性等多方面的挑战。

阿里云正借助百炼平台努力攻克大模型落地难关,使得开发者仅需简单“拖拽”操作,便能在5分钟内打造出一款大模型应用,并在数小时内炼制出个性化的专属模型,显著降低了开发难度。然而,不得不坦言,百炼平台在面向大模型商业应用开发者的知名度上,与字节COZE相比,仍存在较大差距。

更不必说,现阶段大规模模型的商业转化途径尚不清晰,如何制定恰当的收费方案、如何与既有业务相融合,以及如何规避同质化竞争,这些问题都是阿里云以及所有大型基础模型开发者必须面对和解决的。

值得注意的是,阿里集团的模型应用战略似乎正在经历一番调整。以往它更倾向于服务B端客户,而现在开始转向关注C端用户。例如,上个月夸克推出了全新的功能,同时通义APP也在不断进行升级和改版,这些举措都是针对C端用户的优化。由此可见,阿里云正试图在更广泛的市场领域内寻找大模型的新增长点。

总体来看,通义千问Qwen3的崭露头角,标志着我国人工智能领域的最新成就。然而,从技术卓越迈向商业成功,其间尚需跨越一段漫长的征程。阿里云如何在全球AI竞争的激烈环境中保持技术优势,并有效解决商业落地的挑战,这将成为其未来在人工智能时代地位的关键所在。可以明确的是,我国企业在全球人工智能产业领域已经处于领先地位,在这场东西方科技力量此消彼长的变革浪潮中,他们展现出了空前的实力和十足的信心。

相关内容 查看全部