Follow

炸裂!阿里重磅发布 Qwen3(千问3) 全球最强开源模型,引爆整个 AI 技术圈!

作为国内首个 “混合推理模型”,在性能上全面超越 DeepSeek R1等一众领先模型,创下国产模型及全球开源模型新高。

为了满足大家各种使用场景,共开源了 8 个不同尺寸千问 3 “混合推理模型”,且每一个在同尺寸模型上性能最优,全部都可免费商用。

其中旗舰版 Qwen3-235B-A22B 模型,仅4张H20即可部署,显存占用仅为性能相近模型的三分之一。

另外千问 3 还原生支持了 MCP 协议,在工具调用能力方面表现相当出色,搭配此前开源的 Qwen-Agent 开发框架使用,可以充分发挥千问 3 的 Agent 能力。

下面,再带大家一起去测试下模型。

我们先来个简单的提问测试:“Qweeeeen 里面有多少个 e?”

测试结果如图 4,可以看到千问 3 轻轻松松就给出了准确答案 “5 个”。

接着加大难度,来一道大厂很喜欢用来面试大家逻辑推理能力的题目:

“烧一根不均匀的绳要用一个小时,如何用它来判断半个小时?烧一根不均匀的绳,从头烧到尾总共需要一个小时。现在有若干条材质相同的绳子,问如何用烧绳的方法来计时一个小时十五分钟呢?”

过程与结果如图 5,差点把CPU 干冒烟,不过在深度思考推理之后,还是给出了正确的答案。

最后,再来测试下模型的多模态推理任务,用一张爆火测试图片 “六个手指图”,让模型告诉我图中有几个手指:

结果如图 6,没能通过测试。然后我试了 OpenAI o3、Gemini 2.5 Pro 和 Claude 3.7 Sonnet 模型,它们也同样失败,这或许将是推理模型下一个迭代优化的方向了。

大家不妨也去试试,目前所有模型均可通过 ModelScope、HuggingFace 等平台下载使用,也可以在通义千问 Web 或 App 上在线体验。

Qwen Chat: 网页链接

Hugging Face: 网页链接

ModelScope: 网页链接

GitHub: https:// 网页链接

:icon_weibo: weibo.com/5722964389/PptENBEVB

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。