炸裂!阿里重磅发布 Qwen3(千问3) 全球最强开源模型,引爆整个 AI 技术圈!

作为国内首个 “混合推理模型”,在性能上全面超越 DeepSeek R1等一众领先模型,创下国产模型及全球开源模型新高。

为了满足大家各种使用场景,共开源了 8 个不同尺寸千问 3 “混合推理模型”,且每一个在同尺寸模型上性能最优,全部都可免费商用。

其中旗舰版 Qwen3-235B-A22B 模型,仅4张H20即可部署,显存占用仅为性能相近模型的三分之一。

另外千问 3 还原生支持了 MCP 协议,在工具调用能力方面表现相当出色,搭配此前开源的 Qwen-Agent 开发框架使用,可以充分发挥千问 3 的 Agent 能力。

下面,再带大家一起去测试下模型。

我们先来个简单的提问测试:“Qweeeeen 里面有多少个 e?”

测试结果如图 4,可以看到千问 3 轻轻松松就给出了准确答案 “5 个”。

接着加大难度,来一道大厂很喜欢用来面试大家逻辑推理能力的题目:

“烧一根不均匀的绳要用一个小时,如何用它来判断半个小时?烧一根不均匀的绳,从头烧到尾总共需要一个小时。现在有若干条材质相同的绳子,问如何用烧绳的方法来计时一个小时十五分钟呢?”

过程与结果如图 5,差点把CPU 干冒烟,不过在深度思考推理之后,还是给出了正确的答案。

最后,再来测试下模型的多模态推理任务,用一张爆火测试图片 “六个手指图”,让模型告诉我图中有几个手指:

结果如图 6,没能通过测试。然后我试了 OpenAI o3、Gemini 2.5 Pro 和 Claude 3.7 Sonnet 模型,它们也同样失败,这或许将是推理模型下一个迭代优化的方向了。

大家不妨也去试试,目前所有模型均可通过 ModelScope、HuggingFace 等平台下载使用,也可以在通义千问 Web 或 App 上在线体验。

Qwen Chat: 网页链接

Hugging Face: 网页链接

ModelScope: 网页链接

GitHub: https:// 网页链接

:icon_weibo: weibo.com/5722964389/PptENBEVB

又发现了一款开源的批量字幕翻译工具:Subtitle Translator,具备秒级翻译能力。

支持多种翻译接口(API + AI 大模型),支持 .srt、.ass、.vtt 等格式,还能将同一字幕文件同时翻译成多达 35 种语言,满足各种国际化需求。

GitHub: github.com/rockbenben/subtitle

主要功能:

- 秒级翻译:1 秒内完成一集电视剧字幕翻译;

- 批量处理:一次性处理上百个字幕文件;

- 支持 AI 大模型:接入 OpenAI、DeepSeek 等主流大模型,可自定义提示词和风格;

- 翻译缓存:自动保存结果避免重复调用节省 API 费用;

- 双语字幕:可在原文下方显示译文;

- 多语言同时翻译:一次操作输出多种语言字幕文件。

无需安装任何软件,提供网页操作界面,可快速部署到 CloudFlare 或 Vercel 使用。

:icon_weibo: weibo.com/5722964389/PpoaDrnjE

写论文或整理研究资料时,用 Word 写作、Zotero 管理参考文献、笔记应用整理思路…在多个工具之间来回切换。

偶然发现,Zettlr 这款开源工具正好解决了这痛点,让我们能高效专注于内容创作。

它不仅支持与 Zotero、JabRef 等引用管理工具深度集成,还提供了 LaTeX 和 Word 模板支持,配合 Pandoc 实现专业级排版输出,让整个写作到发布的过程无缝衔接。

GitHub: github.com/Zettlr/Zettlr

主要特性:

- 隐私优先设计,所有笔记都在本地保存;

- 支持十几种语言,包括完整的中文界面;

- 与主流引用工具(如 Zotero、JabRef)深度集成,引用文献超简单;

- 支持代码高亮、黑暗模式和自定义 CSS 主题;

- 内置 Zettelkasten 知识管理方法,帮助组织复杂知识;

- 强大的全文搜索功能,快速定位任何信息。

支持 Windows、macOS 和 Linux,从官网下载对应安装包,即可使用。

:icon_weibo: weibo.com/5722964389/PpmZzr8Jr

有时候我们需要临时保存一段代码、一篇笔记或者一张图片,还要能方便地分享给他人,现有的平台要么操作太复杂,要么没有设置访问权限功能。

最近发现的 QBin 一键存储开源项目刚好解决了这个痛点,它让我们能轻松保存任何类型的内容并按需分享,甚至断网状态下也能正常使用!

GitHub: github.com/quick-bin/qbin

主要功能:

- 极简存储:一键保存文字、代码、Markdown、图片、音视频等任意类型内容

- 安全可控:支持自定义访问路径和密码保护,保障隐私安全

- 灵活期限:可设置内容有效期,过期自动删除不留痕迹

- 离线编辑:内置 PWA 与本地缓存,断网也能继续工作和查看

- 多种登录:支持账号密码和 OAuth2 多平台登录方式

- 明暗主题:支持深色/浅色/跟随系统模式,夜间使用更护眼

通过 Docker 一键部署即可使用,可作为 Cloud Note 和 PasteBin 的开源平替方案。

:icon_weibo: weibo.com/5722964389/Ppm0GxxxX

分享 GitHub 上一款强大的内网穿透开源工具:Wiredoor。

提供直观的 Web 界面管理所有服务,自动配置 SSL 证书,无需复杂配置,轻松安全地把内部服务暴露到公网。

GitHub: github.com/wiredoor/wiredoor

主要功能:

- 基于 WireGuard 的高性能安全隧道,延迟极低

- 内置 NGINX 反向代理,轻松管理多个服务

- 自动申请 Let’s Encrypt SSL 证书,保障访问安全

- 简洁易用的 Web 界面,简化服务和域名管理

- 支持 Kubernetes、Docker 等多环境集成

- 提供命令行工具,方便自动化部署和管理

只需在公网服务器上部署 Docker 容器,并配置简单环境变量,即可开始使用。

:icon_weibo: weibo.com/5722964389/Ppj42p4sp

注册新网站时,找个简短好记的域名颇为头疼,此时 Domain Scanner 这款域名扫描工具能派上用场。

它能帮助我们快速筛选真正可用的域名,不仅能同时检查 DNS 记录、WHOIS 信息和 SSL 证书,还支持用正则表达式筛选、多线程并发扫描,甚至能直观显示已注册域名的验证签名。

GitHub: github.com/xuemian168/domain-s

主要功能:

- 多种验证方法综合检查,杜绝误判

- 高并发多线程扫描,检查速度提升数倍

- 灵活的正则表达式过滤,精准定位理想域名

- 智能错误处理和重试机制,结果更可靠

- 实时进度跟踪,直观显示扫描状态

- 分类保存结果,方便后续筛选和使用

工具基于 Go 开发,克隆项目代码到本地,并安装依赖,就能开始使用这个强大的域名扫描工具。

:icon_weibo: weibo.com/5722964389/PpeK8y71u

Bilive 这款 B 站直播录制开源工具,有点强到离谱!

不仅能 7x24 小时自动录制直播和弹幕,还能用 AI 识别语音生成字幕,还可以根据弹幕密度找出高能片段并切片。

甚至直接使用 AI 生成有趣的标题和视频封面,全程无需人工干预 ,最赞的是对电脑配置要求极低。

GitHub: github.com/timerring/bilive

主要特性:

- 超快录播处理流水线,比直播结束仅慢半小时;

- 自动渲染弹幕到视频中,包括付费留言和礼物信息;

- 集成 OpenAI Whisper 等多种模型自动识别语音转字幕;

- 根据弹幕密度自动找出精彩片段并生成切片;

- 支持多种 AI 模型自动生成吸引人的视频封面;

- 极低硬件要求,无需 GPU 也能完成全部流程;

- 多架构支持,兼容 amd64 和 arm64 系统。

提供详细使用教程,可通过 Docker 或源码部署,搞直播切片的创作者值得一试这工具。

:icon_weibo: weibo.com/5722964389/Ppdz50JRG

发现一款功能强大的开源图像编辑模型:Step1X-Edit,提供与 GPT-4o、Gemini2 这些闭源相媲美的编辑效果,而且完全开源!

只需一句简单的指令就能完成复杂的编辑任务,能准确理解指令和参考图像,轻松完成在 PS 上需花几十分钟的各种操作。

GitHub: github.com/stepfun-ai/Step1X-E

在线体验:huggingface.co/spaces/stepfun-ai/Step1X-Edit

主要亮点:

- 通过自然语言指令精确控制图像编辑效果;

- 支持 512 至 1024 分辨率的图像处理;

- 编辑速度超快,512x512 分辨率仅需 5 秒

- 提供 ModelScope 和 HuggingFace 在线演示;

- 开源的评估基准 GEdit-Bench,基于真实用户需求;

- 各种详细的使用范例和全面的文档说明。

不过,对性能配置要求颇高,建议使用 80GB 以上显存以获得更好的生成效果。

:icon_weibo: weibo.com/5722964389/PpcAc0wMe

如果想深入学习大模型预训练相关知识,可以看下这份资料合集:Awesome LLM Pre-training。

精心整理了预训练相关的技术报告、训练策略、开源数据集以及数据方法等内容,提供了一站式的学习入口。

GitHub: github.com/RUCAIBox/awesome-ll

无论是熟悉深度学习的开发者,还是刚接触大模型开发的新手,这份资料对我们学习大模型预训练非常实用。

:icon_weibo: weibo.com/5722964389/PpbcXcm6Y

月之暗面开源了一个音频基础模型:Kimi Audio,能同时处理音频理解、生成和对话。

基于 Kwen 2.5 7B 模型构建,实现既能输出高质量文本又能生成自然语音,解决了我们处理音频时来回切换不同工具的痛点。

GitHub: github.com/MoonshotAI/Kimi-Aud

模型下载:huggingface.co/moonshotai/Kimi-Audio-7B-Instruct

主要特性:

- 语音识别(ASR)性能超越多个基准,在 AISHELL-1 上 WER 仅为 0.60%;

- 支持音频理解任务,包括声音分类、音频问答和情感识别;

- 端到端语音对话能力,支持语速、口音和情感控制;

- 高效的流式处理机制,实现低延迟音频生成;

- 开源评估工具包,可轻松复现和对比不同模型性能;

- 预训练于超过 1300 万小时的多样化音频和文本数据。

模型 Kimi-Audio-7B-Instruct 已发布,可通过 HuggingFace 下载使用。

:icon_weibo: weibo.com/5722964389/PpaOBbaHP

在尝试使用 MCP 服务器时,很多人都遇到过安装配置繁琐、环境依赖复杂的问题,特别需要同时管理多个 MCP 服务器,更加头疼。

开源项目 MCP Containers 试图改变这一现状,它将数百个常用 MCP 服务器打包成即用即取的 Docker 镜像,直接一键部署各种 AI 能力扩展的 MCP 工具。

GitHub: github.com/metorial/mcp-contai

主要功能:

- 一键部署体验,通过简单的 Docker 命令即可使用任何 MCP 服务器

- 自动更新机制,服务器镜像每日更新,始终与源仓库同步

- 安全隔离环境,各服务器在独立容器中运行互不干扰

- 支持数百种 MCP 服务器,从网络搜索、浏览器控制到各类 API 集成

- 丰富的文档和使用指南,帮助快速上手

只需拉取需要的 Docker 镜像即可,同时每一个 MCP 服务器都有详细的使用教程。

:icon_weibo: weibo.com/5722964389/Pp4J6FRZO

在阅读学术论文时,总是被一堆专业术语和复杂公式绕晕,特别是外语论文,遇到不懂的单词,还需要与翻译工具来回切换,效率极低。

最近一个中文名叫 “暴躁的教授读论文” 的开源项目拯救了我们,它让一位带有点脾气的 AI 教授来辅助我们高效阅读论文。

该工具不仅能自动提取论文内容并支持中英双语对照阅读,还能用暴躁有趣的语气回答我们对论文的各种问题,甚至支持语音对话,让阅读专业文献不再枯燥无味。

GitHub: github.com/LYiHub/mad-professo

主要功能:

- 论文自动处理:导入 PDF 后自动提取、翻译和结构化内容

- 中英文对照阅读:随时切换语言,减少查词翻译困扰

- AI 智能问答:针对论文内容提供专业解释和分析

- 个性化”暴躁教授”:以幽默暴躁风格解答,增加趣味性

- 语音交互:支持语音提问和 AI 语音回答

- 分屏高效界面:左侧论文内容,右侧 AI 问答

提供了详细的安装步骤,需 6GB 以上显存运行,适合需要高效阅读论文的学术党使用。

:icon_weibo: weibo.com/5722964389/Pp48AEtf9

平时在做市场调研或数据收集时,经常需要在十几个网站之间不停切换,复制粘贴信息,然后手动整理成报告,真的特别耗时又容易出错。

今日 GitHub Trending 榜首开源项目 Suna,解决了这个痛点,通过简单对话就能完成任务。

它将浏览器自动化、文件管理、网络爬虫和 API 集成等强大功能无缝结合,帮助我们分析竞争对手、规划行程、处理数据,甚至自动执行复杂工作流程,全程只需通过自然对话即可完成。

GitHub: github.com/kortix-ai/suna

主要功能:

- 智能浏览器自动化,能模拟人类操作网页并提取数据

- 强大的文件管理功能,可创建和编辑各类文档

- 网络爬虫和扩展搜索能力,轻松获取多源信息

- 命令行执行能力,可直接执行系统任务

- 支持与各种 API 和服务的集成,扩展使用场景

- 所有操作都在隔离的 Docker 环境中执行,保证安全

适合用来高效处理信息收集和分析,有需求的可通过自托管方式安装使用,提供了详细的教程。

:icon_weibo: weibo.com/5722964389/Pp1Msyw0R

想要让玩具、公仔变得会说话、有情感,现有的方案要么太贵太复杂,要么就是需要一直连着手机,用起来特别不方便。

为了解决这些问题,GitHub 上开源项目 ElatoAI 给出了解决方案,基于 ESP32 微控制器和 OpenAI Realtime API 开发。

它能让你的玩具变成真正的 AI 伙伴,支持超过 10 分钟的连续自然对话,语音识别和回应都非常流畅。

GitHub: github.com/akdeb/ElatoAI

主要功能:

- 实时语音转语音:基于 OpenAI 实时 API,对话极其自然流畅

- 自定义 AI 角色:可以设置不同的性格和声音

- 简单硬件设计:只需一块 ESP32-S3 开发板即可实现

- 安全通信:使用加密 WebSocket 传输数据

- 全球低延迟:依靠 Deno Edge Functions 实现全球范围内低于 1 秒的延迟

该项目的前端、服务器和固件代码已开源,对 AI 玩具或 AI 伴侣等产品感兴趣的开发者可以看下。

:icon_weibo: weibo.com/5722964389/Pp0j407Qu

作为开发者,用 AI 写代码时最痛苦的不是让它生成代码,而是让它理解整个项目架构和任务依赖关系。之前总是要手动解释每个任务,反复上下文…颇为折磨。

Task Master这个项目彻底解决了这个问题!它让 Claude 像一位经验丰富的项目经理一样思考,自动拆解 PRD(需求文档),生成任务列表,并追踪进度。

GitHub: github.com/eyaltoledano/claude

主要特性:

- 自动解析 PRD 并生成结构化任务体系,包含 epic 和子任务

- 管理任务间的依赖关系,确保开发顺序合理

- 直接在编辑器中通过自然语言沟通整个开发流程

- 让 AI 按照人类工程师的思维模式进行任务分析和执行

- 无缝整合进现有开发工作流,降低 AI 使用门槛

可通过编辑 MCP 配置,轻松接入到 Cursor 或 Windsurf 等开发编辑器,让它成为我们高效的开发伙伴。

:icon_weibo: weibo.com/5722964389/PoQMxzrS7

以前分享过不少不同文件转 Markdown 的工具,后来发现 Markdown 转其他文件格式同样也是有需求。

在此跟大家分享一款 Markdown 转换为 Docx 文档的开源工具:markdown-docx。

支持图片、表格、列表、代码块等 Markdown 元素,以及超链接与脚注,并可自定义样式。

GitHub: github.com/vace/markdown-docx

允许在浏览器和 Node.js 环境运行,并提供命令行工具,有需求的可以试试。

:icon_weibo: weibo.com/5722964389/PoKiHwT9k

推荐 GitHub 上一款强大的社交媒体内容分析 AI 工具:Secretary。

利用该工具自动抓取监控指定账号的最新发表内容,通过 AI 进行分析,并将结构推送到企业/个人微信。

GitHub: github.com/zkd8907/secretary

主要功能:

- 支持多平台监控(Twitter 和 Truth Social)

- 可配置多个监控账号和分析提示词

- 支持多维度分析(财经、科技等)

- 使用 AI 进行内容翻译和智能分析

- 支持推送到企业微信机器人和个人微信

提供了详细的使用指南,按要求配置好环境变量后,即可运行。

:icon_weibo: weibo.com/5722964389/PoIVsB1vq

又一款开源免费的会议笔记 AI 工具:Hyprnote。

使用开源模型 Whisper 和 Llama,可完全离线运行,自动录音、转录会议内容,并结合我们随手记下的要点一键生成高质量的会议总结。

GitHub: github.com/fastrepl/hyprnote

所有数据存储在本地安全隐私,并提供类似 VSCode 的扩展框架,可根据自己需求进行高度定制。

目前已提供 macOS 版本,可通过 Homebrew 一键安装,未来还会推出 Windows 和 Linux 版本。

:icon_weibo: weibo.com/5722964389/PoHm36QXo

往后阅读长篇小说时,我们可以快速了解到各个角色之间的关系了,对故事线将会有更加整体理解。

我们可以利用 GitHub 上这款由 AI 驱动的书籍角色关系可视化工具:Austen。

它能自动分析任何书籍的人物关系并生成美观易懂的交互式关系图标,帮助我们更直观地把握故事脉络。

GitHub: github.com/herol3oy/austen

主要特性:

- 搜索并分析 Open Library 上的任何书籍

- AI 智能分析书中人物关系并生成图谱

- 生成直观易懂的 Mermaid 关系图表

- 支持保存、下载(SVG、PNG)和管理生成的图表

- 可选择公开分享图表或保持私密

- 发现并浏览其他用户生成的公开图表

提供详细的本地部署方式,按照 README 中的步骤即可完成安装。

:icon_weibo: weibo.com/5722964389/PoD29vhGm

又在 GitHub 上发现一份从零开始构建 LLM 的开源教程:tiny-llm。

基于 MLX 实现,教授了如何在 Mac 电脑上一步步构建出一个大模型,整个教程不使用复杂的高级接口,而是从最基础的教学运算开始讲解。

GitHub: github.com/skyzh/tiny-llm

主要内容:

- 三周学习计划:从简单的 Python 代码到复杂的性能优化;

- 手把手实现大语言模型的核心组件:注意力机制、位置编码等;

- 详细解释每个组件背后的原理,附有大量参考资料;

- 以主流的 Qwen2 模型为例,帮助我们理解大模型是如何工作的;

- 适合想了解 AI 底层技术的技术爱好者和工程师。

教程适合在 Mac电脑上学习,面向想了解 AI 底层技术的系统工程师和开发者。

:icon_weibo: weibo.com/5722964389/PoAScCxWZ

Show older
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。