分享 GitHub 上一个简单高效的强化学习后训练框架:RL-Factory,专门用于智能体学习。
该框架采用环境解耦设计,只需提供工具配置和奖励函数就能开始训练,还支持异步工具调用让训练速度提升 2 倍。
GitHub: https://github.com/Simple-Efficient/RL-Factory
主要功能:
- 环境解耦设计,一键式配置 MCP 工具和自定义工具;
- 异步并行工具调用,训练效率比传统框架提升 2 倍;
- 原生支持 Qwen3 模型,无需 SFT 即可准确调用工具;
- 多种奖励计算方式,支持规则、模型判断和工具调用;
- 批处理和分布式模型判断,大幅提升训练效率;
- 多代理扩展支持,可转换为 MCP 格式进行交互。
旨在让我们每个人都能轻松快速地使用 Qwen3 和 MCP 工具训练出自己的智能代理。
具有一定强化学习基础的开发者感兴趣的可以看一下。
上周 I/O 大会上,谷歌向全球开放了 Jules 的公测,这是一款真正能独立工作的 AI 编程助手。
基于 Gemini 2.5 Pro 模型,能在后台 Google Cloud 虚拟机中独立完成整个开发流程,从理解代码到制定计划再到提交代码,全程无需我们监督。
在线体验: 网页链接
此外 GitHub 上有一份专为 Jules 精心挑选的提示词合集:Awesome Jules Prompts。
包含了日常开发任务、调试、文档、测试以及从零构建项目等相关的提示词。
GitHub: https://github.com/google-labs-code/jules-awesome-list
Jules 每天有提供了 5 个免费任务次数,大家可以参考这些提示词去测试看看。
跟前端开发者分享一款开源免费的编译器:js-to-exe,能直接将 JS/TS 代码编译成独立可运行的 exe 文件。
该编译器基于 esbuild 实现超快编译速度,生成的文件只有 70-80MB 相当轻量,并且支持最新版本的 Node.js 和 ESM 模块。
GitHub: https://github.com/astracompiler/cli
主要功能:
- 将 JavaScript/TypeScript 应用编译成单一可执行文件;
- 生成文件体积小,仅 70-80MB 比同类工具更轻量;
- 支持最新 Node.js 版本和 ESM 模块系统;
- 基于 esbuild 实现超快编译速度;
- 可自定义可执行文件图标、名称、版本等元数据;
- 优秀的开发者体验,提供友好的命令行界面。
通过 npm 全局安装后,一条命令即可编译,适合需要分发应用的前端开发者。
GitHub 上一份面向机器学习工程师的 Kubernetes 入门教程:Kubernetes for ML Engineers,助力大家轻松掌握容器化部署。
该教程是通过 Kind 搭建本地 Kubernetes 集群,配合 FastAPI 应用实例,手把手教授我们从容器化到服务部署的完整流程。
GitHub: https://github.com/Paulescu/kubernetes-for-ml-engineers
主要内容:
- 本地 Kubernetes 集群搭建,使用 Kind 工具快速创建测试环境;
- FastAPI 应用容器化,学习 Docker 多阶段构建最佳实践;
- Kubernetes 服务部署,掌握 Deployment 和 Service 资源配置;
- 完整的工具链介绍,包括 uv、Docker、kubectl 等必备工具;
- 逐步进阶的学习路径,从基础概念到实际部署操作;
- 生产环境部署指导,了解云平台 Kubernetes 服务选择。
只需按照教程步骤操作即可快速上手,适合想要掌握模型部署技能的 ML 工程师和 AI 开发者。
微软开源了一套完整的 AI 对抗性安全训练体系:AI Red Teaming Playground Labs,帮助我们更好地学习 AI 安全测试。
这套实验室包含 12 个渐进式挑战,涵盖提示注入、元提示提取、多轮攻击等核心 AI 攻击技术,并基于微软 Chat Copilot 构建真实测试环境。
GitHub: https://github.com/microsoft/AI-Red-Teaming-Playground-Labs
主要内容:
- 凭据窃取挑战,学习通过社会工程学获取敏感信息;
- 元提示提取技术,掌握从 AI 系统中挖掘隐藏指令的方法;
- Crescendo 多轮攻击,练习绕过 AI 安全防护的高级技巧;
- 间接提示注入,了解通过修改网页内容攻击 AI 系统;
- 安全防护绕过,学习突破各种 AI 内容审查机制;
- 三个难度级别设计,从入门到专业逐步提升技能。
通过 Docker Compose 一键部署即可开始练习,适合想深入了解 AI 安全的技术人员和开发者。
用 Selenium 写自动化脚本时,经常遇到元素加载时机问题导致测试失败,还要手动处理各种浏览器驱动,颇为头疼。
在寻找解决方案时,发现了 SeleniumBase 这个强大的 Python 框架,解决了我们在 Web 自动化中的各种痛点,让复杂的浏览器操作变得简单可靠。
它基于 Selenium 进行了深度封装,内置智能等待机制和自动截图功能,还支持隐身模式绕过检测,提供了完整的测试报告和仪表板。
GitHub: https://github.com/seleniumbase/SeleniumBase
主要功能:
- 智能等待机制,彻底告别不稳定的测试脚本;
- 多种编写方式,支持 BaseCase 类继承和 SB 上下文管理器;
- UC Mode 隐身模式,轻松绕过 Cloudflare 等反爬检测;
- 内置测试报告和实时仪表板,可视化展示测试结果;
- 自动驱动管理,无需手动下载配置浏览器驱动;
- 丰富的断言方法和页面操作,代码更简洁易读。
如果在日常有 Web 自动化开发需求,这个项目值得一看。
微软在 GitHub 上开源的一个项目:Qlib,可能是目前业内最完整的 AI 量化投资平台,截止目前已狂揽 20k+ 星。
基于强大的数据处理引擎和丰富的模型库,涵盖监督学习、强化学习等多种范式,让我们能快速构建从想法到生产的完整量化研究流程。
GitHub: https://github.com/microsoft/qlib
主要特性:
- 高效数据服务器,处理速度比传统数据库快几十倍;
- 集成 30+ 种 SOTA 量化模型,包括 Transformer、LSTM、LightGBM 等;
- 支持强化学习交易策略,可建模连续投资决策过程;
- 完整的投资链条覆盖:因子挖掘、风险建模、组合优化、订单执行;
- 提供自动化研究工具 qrun,一键完成建模到回测全流程;
- 支持市场动态适应和概念漂移处理,提升模型稳定性。
项目提供详细部署安装使用教程,适合想要做金融 AI 的开发者研究学习。
想要深入学习 AI 智能体的构建,可以看下 Master AI Agentic Engineering 这门开源课程。
通过通过 6 周完整学习计划,使用 OpenAI Agents SDK、CrewAI、LangGraph、AutoGen 和 MCP 等主流框架,从零开始构建真正的自主 AI 智能体。
GitHub: https://github.com/ed-donner/agents
包含了丰富的实践项目和代码示例,采用理论与实践相结合方式,从基础概念到高级应用。
并且提供 Windows、macOS 和 Linux 系统完整的环境配置指南。
环境配置好即可开始学习,适合想要系统掌握 AI 智能体工程的初学者。
在电脑和手机之间传个文字、图片或文件,常常打开微信发给自己,或者用各种云盘中转,颇为麻烦。
跟大家分享 GitHub 上一款好用的多设备剪贴板开源工具:SyncClipboard 。
它通过服务器同步各设备的剪贴板内容,支持文字、图片和文件,还能解决从浏览器复制动态图变静态的问题,甚至能自动转换图片格式。
GitHub: https://github.com/Jeric-X/SyncClipboard
主要功能:
- 多设备剪贴板实时同步,支持文字、图片和文件;
- 从浏览器复制图片时自动下载原图,保留动态图效果;
- 智能图片格式转换,解决不同应用间的兼容性问题;
- 支持 WebDAV 网盘作为服务器,也可独立部署;
- iOS 通过快捷指令、Android 通过多种工具实现同步;
- 支持自动提取并同步短信验证码。
服务器支持 Docker 一键部署,提供全平台桌面客户端,并内置了服务器功能,有需要的可以试下。
GitHub 上一份学术资源中文翻译合集:gpt-translated-pdf-zh,学习路上的宝藏库。
整理了众多计算机科学、数学、机器学习领域的经典教材中文翻译版,涵盖从基础算法到前沿 AI 技术的各个方面。
GitHub: https://github.com/it-ebooks-0/gpt-translated-pdf-zh
所有资料都是 PDF 格式,下载后即可离线阅读,值得看下有没有你在寻找的资料中文翻译版。
在 GitHub 上发现一个集成多个 Agent 的 DeepResearch 开源项目:DeepResearchAgent,从官方给的 GAIA 基准测试得分中,看到大幅超越 OpenAI Deep Research。
它采用的是分层架构,顶层负责任务规划分解,底层自动分配给专业的智能体执行深度分析、研究和浏览器自动化操作。
GitHub: https://github.com/SkyworkAI/DeepResearchAgent
主要特性:
- 智能任务分解,自动将复杂任务拆分为可执行步骤;
- 深度分析代理,提取关键信息和潜在需求;
- 深度研究代理,自动生成研究报告和知识摘要 ;
- 浏览器自动化,支持网页搜索和数据收集;
- 多智能体协作,动态协调各代理高效执行;
- 可扩展架构,支持集成更多专业化代理。
通过本地部署运行,并配置 API 密钥即可使用,对 DeepResearch 感兴趣的开发者可以看下这个项目。
在终端里执行命令遇到报错或需要帮助时,经常在浏览器和终端之间来回切换,很是折腾。
不妨试下 OpenCode 这款终端 AI 助手,让我们可以直接在命令行里获得 AI 的帮助,无需离开当前工作环境。
基于 Go 语言开发,支持 OpenAI、Claude、Gemini 等主流 AI 模型,还能直接操作文件、执行命令和分析项目代码。
GitHub: https://github.com/sst/opencode
主要功能:
- 终端 UI 界面,遇到问题立即获得 AI 帮助;
- 支持 OpenAI、Claude、Gemini 等多种 AI 提供商 ;
- 集成文件查看、代码分析、bash 命令执行等工具;
- 会话管理和持久化存储,保存对话历史;
- LSP 协议支持,提供代码智能诊断和建议;
- MCP 协议集成,可扩展外部工具和服务。
通过脚本一键安装或使用 Homebrew 安装即可,适合经常需要在终端上工作的开发者。
在处理 PDF 文档,想提取里面的文字、表格或图片特别麻烦,不同的库有不同的用法,经常要写一堆重复代码。
ParseStudio 这个 Python 库把各种解析器统一封装起来,只需用几行代码就能搞定 PDF 解析。
同时集成了 Docling、PyMuPDF 和 Llama Parse 三种解析引擎,可以根据需求灵活切换,无论是提取文本、表格还是图片都很方便。
GitHub: https://github.com/chatclimate-ai/ParseStudio
主要特性:
- 模块化设计,可在多种解析器间自由切换;
- 多模态解析,同时提取文本、表格和图片;
- API 设计简洁,几行代码完成复杂解析任务;
- 表格自动转换为 Markdown 格式,便于后续处理;
- 图片提取包含页码、位置等元数据信息;
- 支持批量处理多个 PDF 文件。
适合熟悉 Python 代码以及需批量处理 PDF 文档的开发者使用。
GitHub 上一个开源项目 Streaming-KokoroJS,能让文本转语音完全在浏览器本地运行,开源免费且保护隐私!
基于 Kokoro-82M 模型,实现在浏览器中实时生成高质量语音,并支持多种语音风格、WebGPU 加速和流式播放。
GitHub: https://github.com/rhulha/StreamingKokoroJS
主要功能:
- 100% 本地处理,无需上传文本到服务器;
- WebGPU 自动加速,没有也能用 WASM 运行;
- 智能文本分块,保持自然语音节奏;
- 支持多种语音风格,适应不同语言需求;
- 流式音频生成,边转换边播放不卡顿;
- 可下载生成的音频文件到本地保存。
首次打开网页,会下载一个约 300M 模型,下载完成后即可使用,适合比较重视数据隐私的创作者。
开发项目想要快速搭建数据 API,传统方式需搭建服务器并编写大量后端代码,对于不熟悉后端的前端开发者来说,既耗时又耗精力。
无独有偶,发现 SQL to API 开源项目能帮我们解决这个问题,只需写 SQL 就能直接生成 REST API。
基于 Cloudflare Workers 和 D1 数据库实现,支持通过 Web 界面管理 API、参数化查询和实时测试,还内置了 SQL 注入防护。
GitHub: https://github.com/123xiao/Cloudflare-SQL-to-API
主要功能:
- 零后端代码,纯 SQL 语句即可创建 API 接口;
- Web 可视化管理界面,支持 API 创建和测试;
- 参数化查询支持,可动态替换 SQL 中的参数值;
- 基于 Cloudflare 全球网络,响应速度超快;
- 内置安全防护,自动防范 SQL 注入攻击;
- API 调用日志记录,便于调试和监控。
提供了在线演示 Demo 体验,感兴趣的可本地安装并部署到 Cloudflare 使用。
来自微软开源的项目:Magentic-UI,提供了全新的人机协作网页自动化体验。
基于 AutoGen 框架的多智能体系统,能够让我们与 AI 助手协作完成复杂网页任务,既保持了自动化效率又确保了人工控制权。
GitHub: https://github.com/microsoft/magentic-ui
主要特性:
- 协作规划功能,与 AI 共同制定和编辑任务执行步骤;
- 实时任务监控,可随时中断并指导 AI 的执行过程 ;
- 敏感操作保护,重要动作需要人工确认才能执行;
- 智能计划学习,从历史任务中学习并自动优化未来执行;
- 并行任务处理,同时运行多个任务并显示状态指示器;
- 多智能体协作,包含网页操作、代码执行、文件处理等专业助手。
需要配置 OpenAI API 密钥使用,适合需要处理复杂网页任务的自动化场景。
开发 AI 应用时,经常需要集成各种 MCP 服务器来扩展功能,但网上找到的实现往往零散分布,很难知道哪些好用、哪些适合自己的需求。
面对这个痛点,MCP Registry 开源项目提供了一个中心化的注册表服务,帮我们发现和管理 MCP 服务器。
通过 RESTful API 提供完整的服务器条目管理功能,包括列表查询、详情获取、发布更新等操作,还支持分页和健康监控。
GitHub: https://github.com/modelcontextprotocol/registry
主要功能:
- 中心化的 MCP 服务器注册表,方便发现各种实现;
- RESTful API 支持服务器条目的增删改查操作;
- 分页查询和详细信息获取,快速找到合适的服务器;
- 集成一键发布功能,开发者可轻松分享自己的 MCP 实现;
- 健康检查端点,确保服务稳定运行;
- 支持 MongoDB 和内存数据库,灵活部署。
提供 Docker 一键部署方式,简单配置即可使用,适合正在使用 MCP 服务器的开发者。
平时下载大文件时,传统下载工具不仅速度慢,还经常因为网络问题中断,重新开始下载挺让人头疼的。
在 GitHub 上发现来自一位高三学生开源的项目:Ghost Downloader 3,解决了我们这个痛点。
它能像 IDM 一样智能分块下载但无需合并文件,还配备了 AI 智能加速功能,让下载变得既快速又稳定。
GitHub: https://github.com/XiaoYouChR/Ghost-Downloader-3
主要功能:
- AI 智能加速,显著提升下载速度;
- 智能分块下载,无需手动合并文件;
- 多线程并发下载,充分利用网络带宽;
- 计划任务功能,支持定时下载管理;
- 浏览器插件优化,一键添加下载任务。
跨平台支持 Linux、Windows、macOS 三大系统,可在发布页下载开箱即用安装包。
平时用 AI 工具积累了一堆 Prompt,但真要用的时候总是想不起来放哪了,每次还得复制粘贴,颇为麻烦。
此时,可以尝试使用 MCP Prompt Server 这款 MCP 服务器,把我们常用的 Prompt 变成了可调用的工具,告别复制粘贴。
它将每个 Prompt 模板注册为 MCP 工具,支持自然语言调用,还能在 Raycast、Cursor、Windsurf 等工具中通用。
GitHub: https://github.com/joeseesun/mcp-prompt-server
主要功能:
- 丰富的内置 Prompt 模板,涵盖代码、写作、产品设计等场景;
- 所有 Prompt 自动注册为工具,支持参数化调用;
- 支持热加载,无需重启即可添加新 Prompt;
- 只需添加 YAML 文件即可扩展新功能;
- 适配 Raycast、Cursor、Windsurf 等主流编辑器;
- 自然语言对话即可调用,还能组合多个工具实现复杂工作流。
通过 npm install 安装后配置到 MCP 客户端即可使用。
每次开发完新项目,构建文档介绍站点颇为麻烦,可以试下这个开源的文档框架:Fumadocs,简洁灵活快速搭建。
基于 Next.js 开发,集成了 App Router 路由跳转,支持 MDX、内容集合和各种 CMS,帮我们快速搭建精美的文档网站。
GitHub: https://github.com/fuma-nama/fumadocs
此外,还内置全文搜索、代码高亮和主题切换等功能,并提供 CLI 工具,可一条命令即可创建新项目。
项目完全开源,提供了详细的文档介绍,可通过 Vercel 等平台快速部署。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报