**GitHubDaily** @[email protected] · 2025-04-29T03:00:38Z

GitHubDaily @[email protected]

炸裂！阿里重磅发布 Qwen3（千问3）全球最强开源模型，引爆整个 AI 技术圈！

作为国内首个 “混合推理模型”，在性能上全面超越 DeepSeek R1等一众领先模型，创下国产模型及全球开源模型新高。

为了满足大家各种使用场景，共开源了 8 个不同尺寸千问 3 “混合推理模型”，且每一个在同尺寸模型上性能最优，全部都可免费商用。

其中旗舰版 Qwen3-235B-A22B 模型，仅4张H20即可部署，显存占用仅为性能相近模型的三分之一。

另外千问 3 还原生支持了 MCP 协议，在工具调用能力方面表现相当出色，搭配此前开源的 Qwen-Agent 开发框架使用，可以充分发挥千问 3 的 Agent 能力。

下面，再带大家一起去测试下模型。

我们先来个简单的提问测试：“Qweeeeen 里面有多少个 e？”

测试结果如图 4，可以看到千问 3 轻轻松松就给出了准确答案 “5 个”。

接着加大难度，来一道大厂很喜欢用来面试大家逻辑推理能力的题目：

“烧一根不均匀的绳要用一个小时，如何用它来判断半个小时？烧一根不均匀的绳，从头烧到尾总共需要一个小时。现在有若干条材质相同的绳子，问如何用烧绳的方法来计时一个小时十五分钟呢？”

过程与结果如图 5，差点把CPU 干冒烟，不过在深度思考推理之后，还是给出了正确的答案。

最后，再来测试下模型的多模态推理任务，用一张爆火测试图片 “六个手指图”，让模型告诉我图中有几个手指：

结果如图 6，没能通过测试。然后我试了 OpenAI o3、Gemini 2.5 Pro 和 Claude 3.7 Sonnet 模型，它们也同样失败，这或许将是推理模型下一个迭代优化的方向了。

大家不妨也去试试，目前所有模型均可通过 ModelScope、HuggingFace 等平台下载使用，也可以在通义千问 Web 或 App 上在线体验。

Qwen Chat：网页链接

Hugging Face：网页链接

ModelScope：网页链接

GitHub: https:// 网页链接