炸裂!阿里重磅发布 Qwen3(千问3) 全球最强开源模型,引爆整个 AI 技术圈!
作为国内首个 “混合推理模型”,在性能上全面超越 DeepSeek R1等一众领先模型,创下国产模型及全球开源模型新高。
为了满足大家各种使用场景,共开源了 8 个不同尺寸千问 3 “混合推理模型”,且每一个在同尺寸模型上性能最优,全部都可免费商用。
其中旗舰版 Qwen3-235B-A22B 模型,仅4张H20即可部署,显存占用仅为性能相近模型的三分之一。
另外千问 3 还原生支持了 MCP 协议,在工具调用能力方面表现相当出色,搭配此前开源的 Qwen-Agent 开发框架使用,可以充分发挥千问 3 的 Agent 能力。
下面,再带大家一起去测试下模型。
我们先来个简单的提问测试:“Qweeeeen 里面有多少个 e?”
测试结果如图 4,可以看到千问 3 轻轻松松就给出了准确答案 “5 个”。
接着加大难度,来一道大厂很喜欢用来面试大家逻辑推理能力的题目:
“烧一根不均匀的绳要用一个小时,如何用它来判断半个小时?烧一根不均匀的绳,从头烧到尾总共需要一个小时。现在有若干条材质相同的绳子,问如何用烧绳的方法来计时一个小时十五分钟呢?”
过程与结果如图 5,差点把CPU 干冒烟,不过在深度思考推理之后,还是给出了正确的答案。
最后,再来测试下模型的多模态推理任务,用一张爆火测试图片 “六个手指图”,让模型告诉我图中有几个手指:
结果如图 6,没能通过测试。然后我试了 OpenAI o3、Gemini 2.5 Pro 和 Claude 3.7 Sonnet 模型,它们也同样失败,这或许将是推理模型下一个迭代优化的方向了。
大家不妨也去试试,目前所有模型均可通过 ModelScope、HuggingFace 等平台下载使用,也可以在通义千问 Web 或 App 上在线体验。
Qwen Chat: 网页链接
Hugging Face: 网页链接
ModelScope: 网页链接
GitHub: https:// 网页链接