Show newer

分享 GitHub 上一个简单高效的强化学习后训练框架:RL-Factory,专门用于智能体学习。

该框架采用环境解耦设计,只需提供工具配置和奖励函数就能开始训练,还支持异步工具调用让训练速度提升 2 倍。

GitHub: github.com/Simple-Efficient/RL

主要功能:

- 环境解耦设计,一键式配置 MCP 工具和自定义工具;

- 异步并行工具调用,训练效率比传统框架提升 2 倍;

- 原生支持 Qwen3 模型,无需 SFT 即可准确调用工具;

- 多种奖励计算方式,支持规则、模型判断和工具调用;

- 批处理和分布式模型判断,大幅提升训练效率;

- 多代理扩展支持,可转换为 MCP 格式进行交互。

旨在让我们每个人都能轻松快速地使用 Qwen3 和 MCP 工具训练出自己的智能代理。

具有一定强化学习基础的开发者感兴趣的可以看一下。

:icon_weibo: weibo.com/5722964389/PtE8xvEkb

上周 I/O 大会上,谷歌向全球开放了 Jules 的公测,这是一款真正能独立工作的 AI 编程助手。

基于 Gemini 2.5 Pro 模型,能在后台 Google Cloud 虚拟机中独立完成整个开发流程,从理解代码到制定计划再到提交代码,全程无需我们监督。

在线体验: 网页链接

此外 GitHub 上有一份专为 Jules 精心挑选的提示词合集:Awesome Jules Prompts。

包含了日常开发任务、调试、文档、测试以及从零构建项目等相关的提示词。

GitHub: github.com/google-labs-code/ju

Jules 每天有提供了 5 个免费任务次数,大家可以参考这些提示词去测试看看。

:icon_weibo: weibo.com/5722964389/PtCXtyJuf

跟前端开发者分享一款开源免费的编译器:js-to-exe,能直接将 JS/TS 代码编译成独立可运行的 exe 文件。

该编译器基于 esbuild 实现超快编译速度,生成的文件只有 70-80MB 相当轻量,并且支持最新版本的 Node.js 和 ESM 模块。

GitHub: github.com/astracompiler/cli

主要功能:

- 将 JavaScript/TypeScript 应用编译成单一可执行文件;

- 生成文件体积小,仅 70-80MB 比同类工具更轻量;

- 支持最新 Node.js 版本和 ESM 模块系统;

- 基于 esbuild 实现超快编译速度;

- 可自定义可执行文件图标、名称、版本等元数据;

- 优秀的开发者体验,提供友好的命令行界面。

通过 npm 全局安装后,一条命令即可编译,适合需要分发应用的前端开发者。

:icon_weibo: weibo.com/5722964389/PtBYABPBc

GitHub 上一份面向机器学习工程师的 Kubernetes 入门教程:Kubernetes for ML Engineers,助力大家轻松掌握容器化部署。

该教程是通过 Kind 搭建本地 Kubernetes 集群,配合 FastAPI 应用实例,手把手教授我们从容器化到服务部署的完整流程。

GitHub: github.com/Paulescu/kubernetes

主要内容:

- 本地 Kubernetes 集群搭建,使用 Kind 工具快速创建测试环境;

- FastAPI 应用容器化,学习 Docker 多阶段构建最佳实践;

- Kubernetes 服务部署,掌握 Deployment 和 Service 资源配置;

- 完整的工具链介绍,包括 uv、Docker、kubectl 等必备工具;

- 逐步进阶的学习路径,从基础概念到实际部署操作;

- 生产环境部署指导,了解云平台 Kubernetes 服务选择。

只需按照教程步骤操作即可快速上手,适合想要掌握模型部署技能的 ML 工程师和 AI 开发者。

:icon_weibo: weibo.com/5722964389/PtBbT5Bst

微软开源了一套完整的 AI 对抗性安全训练体系:AI Red Teaming Playground Labs,帮助我们更好地学习 AI 安全测试。

这套实验室包含 12 个渐进式挑战,涵盖提示注入、元提示提取、多轮攻击等核心 AI 攻击技术,并基于微软 Chat Copilot 构建真实测试环境。

GitHub: github.com/microsoft/AI-Red-Te

主要内容:

- 凭据窃取挑战,学习通过社会工程学获取敏感信息;

- 元提示提取技术,掌握从 AI 系统中挖掘隐藏指令的方法;

- Crescendo 多轮攻击,练习绕过 AI 安全防护的高级技巧;

- 间接提示注入,了解通过修改网页内容攻击 AI 系统;

- 安全防护绕过,学习突破各种 AI 内容审查机制;

- 三个难度级别设计,从入门到专业逐步提升技能。

通过 Docker Compose 一键部署即可开始练习,适合想深入了解 AI 安全的技术人员和开发者。

:icon_weibo: weibo.com/5722964389/PtAIgdikv

用 Selenium 写自动化脚本时,经常遇到元素加载时机问题导致测试失败,还要手动处理各种浏览器驱动,颇为头疼。

在寻找解决方案时,发现了 SeleniumBase 这个强大的 Python 框架,解决了我们在 Web 自动化中的各种痛点,让复杂的浏览器操作变得简单可靠。

它基于 Selenium 进行了深度封装,内置智能等待机制和自动截图功能,还支持隐身模式绕过检测,提供了完整的测试报告和仪表板。

GitHub: github.com/seleniumbase/Seleni

主要功能:

- 智能等待机制,彻底告别不稳定的测试脚本;

- 多种编写方式,支持 BaseCase 类继承和 SB 上下文管理器;

- UC Mode 隐身模式,轻松绕过 Cloudflare 等反爬检测;

- 内置测试报告和实时仪表板,可视化展示测试结果;

- 自动驱动管理,无需手动下载配置浏览器驱动;

- 丰富的断言方法和页面操作,代码更简洁易读。

如果在日常有 Web 自动化开发需求,这个项目值得一看。

:icon_weibo: weibo.com/5722964389/PtuI3cX0C

微软在 GitHub 上开源的一个项目:Qlib,可能是目前业内最完整的 AI 量化投资平台,截止目前已狂揽 20k+ 星。

基于强大的数据处理引擎和丰富的模型库,涵盖监督学习、强化学习等多种范式,让我们能快速构建从想法到生产的完整量化研究流程。

GitHub: github.com/microsoft/qlib

主要特性:

- 高效数据服务器,处理速度比传统数据库快几十倍;

- 集成 30+ 种 SOTA 量化模型,包括 Transformer、LSTM、LightGBM 等;

- 支持强化学习交易策略,可建模连续投资决策过程;

- 完整的投资链条覆盖:因子挖掘、风险建模、组合优化、订单执行;

- 提供自动化研究工具 qrun,一键完成建模到回测全流程;

- 支持市场动态适应和概念漂移处理,提升模型稳定性。

项目提供详细部署安装使用教程,适合想要做金融 AI 的开发者研究学习。

:icon_weibo: weibo.com/5722964389/PtraRdlSt

想要深入学习 AI 智能体的构建,可以看下 Master AI Agentic Engineering 这门开源课程。

通过通过 6 周完整学习计划,使用 OpenAI Agents SDK、CrewAI、LangGraph、AutoGen 和 MCP 等主流框架,从零开始构建真正的自主 AI 智能体。

GitHub: github.com/ed-donner/agents

包含了丰富的实践项目和代码示例,采用理论与实践相结合方式,从基础概念到高级应用。

并且提供 Windows、macOS 和 Linux 系统完整的环境配置指南。

环境配置好即可开始学习,适合想要系统掌握 AI 智能体工程的初学者。

:icon_weibo: weibo.com/5722964389/PtpD4FN6Z

在电脑和手机之间传个文字、图片或文件,常常打开微信发给自己,或者用各种云盘中转,颇为麻烦。

跟大家分享 GitHub 上一款好用的多设备剪贴板开源工具:SyncClipboard 。

它通过服务器同步各设备的剪贴板内容,支持文字、图片和文件,还能解决从浏览器复制动态图变静态的问题,甚至能自动转换图片格式。

GitHub: github.com/Jeric-X/SyncClipboa

主要功能:

- 多设备剪贴板实时同步,支持文字、图片和文件;

- 从浏览器复制图片时自动下载原图,保留动态图效果;

- 智能图片格式转换,解决不同应用间的兼容性问题;

- 支持 WebDAV 网盘作为服务器,也可独立部署;

- iOS 通过快捷指令、Android 通过多种工具实现同步;

- 支持自动提取并同步短信验证码。

服务器支持 Docker 一键部署,提供全平台桌面客户端,并内置了服务器功能,有需要的可以试下。

:icon_weibo: weibo.com/5722964389/Ptlhy27j8

GitHub 上一份学术资源中文翻译合集:gpt-translated-pdf-zh,学习路上的宝藏库。

整理了众多计算机科学、数学、机器学习领域的经典教材中文翻译版,涵盖从基础算法到前沿 AI 技术的各个方面。

GitHub: github.com/it-ebooks-0/gpt-tra

所有资料都是 PDF 格式,下载后即可离线阅读,值得看下有没有你在寻找的资料中文翻译版。

:icon_weibo: weibo.com/5722964389/Ptk6ubLJ9

在 GitHub 上发现一个集成多个 Agent 的 DeepResearch 开源项目:DeepResearchAgent,从官方给的 GAIA 基准测试得分中,看到大幅超越 OpenAI Deep Research。

它采用的是分层架构,顶层负责任务规划分解,底层自动分配给专业的智能体执行深度分析、研究和浏览器自动化操作。

GitHub: github.com/SkyworkAI/DeepResea

主要特性:

- 智能任务分解,自动将复杂任务拆分为可执行步骤;

- 深度分析代理,提取关键信息和潜在需求;

- 深度研究代理,自动生成研究报告和知识摘要 ;

- 浏览器自动化,支持网页搜索和数据收集;

- 多智能体协作,动态协调各代理高效执行;

- 可扩展架构,支持集成更多专业化代理。

通过本地部署运行,并配置 API 密钥即可使用,对 DeepResearch 感兴趣的开发者可以看下这个项目。

:icon_weibo: weibo.com/5722964389/Ptj7BjgYs

在终端里执行命令遇到报错或需要帮助时,经常在浏览器和终端之间来回切换,很是折腾。

不妨试下 OpenCode 这款终端 AI 助手,让我们可以直接在命令行里获得 AI 的帮助,无需离开当前工作环境。

基于 Go 语言开发,支持 OpenAI、Claude、Gemini 等主流 AI 模型,还能直接操作文件、执行命令和分析项目代码。

GitHub: github.com/sst/opencode

主要功能:

- 终端 UI 界面,遇到问题立即获得 AI 帮助;

- 支持 OpenAI、Claude、Gemini 等多种 AI 提供商 ;

- 集成文件查看、代码分析、bash 命令执行等工具;

- 会话管理和持久化存储,保存对话历史;

- LSP 协议支持,提供代码智能诊断和建议;

- MCP 协议集成,可扩展外部工具和服务。

通过脚本一键安装或使用 Homebrew 安装即可,适合经常需要在终端上工作的开发者。

:icon_weibo: weibo.com/5722964389/PthKmnppc

在处理 PDF 文档,想提取里面的文字、表格或图片特别麻烦,不同的库有不同的用法,经常要写一堆重复代码。

ParseStudio 这个 Python 库把各种解析器统一封装起来,只需用几行代码就能搞定 PDF 解析。

同时集成了 Docling、PyMuPDF 和 Llama Parse 三种解析引擎,可以根据需求灵活切换,无论是提取文本、表格还是图片都很方便。

GitHub: github.com/chatclimate-ai/Pars

主要特性:

- 模块化设计,可在多种解析器间自由切换;

- 多模态解析,同时提取文本、表格和图片;

- API 设计简洁,几行代码完成复杂解析任务;

- 表格自动转换为 Markdown 格式,便于后续处理;

- 图片提取包含页码、位置等元数据信息;

- 支持批量处理多个 PDF 文件。

适合熟悉 Python 代码以及需批量处理 PDF 文档的开发者使用。

:icon_weibo: weibo.com/5722964389/PtgnqBE86

GitHub 上一个开源项目 Streaming-KokoroJS,能让文本转语音完全在浏览器本地运行,开源免费且保护隐私!

基于 Kokoro-82M 模型,实现在浏览器中实时生成高质量语音,并支持多种语音风格、WebGPU 加速和流式播放。

GitHub: github.com/rhulha/StreamingKok

主要功能:

- 100% 本地处理,无需上传文本到服务器;

- WebGPU 自动加速,没有也能用 WASM 运行;

- 智能文本分块,保持自然语音节奏;

- 支持多种语音风格,适应不同语言需求;

- 流式音频生成,边转换边播放不卡顿;

- 可下载生成的音频文件到本地保存。

首次打开网页,会下载一个约 300M 模型,下载完成后即可使用,适合比较重视数据隐私的创作者。

:icon_weibo: weibo.com/5722964389/PtbR6vugY

开发项目想要快速搭建数据 API,传统方式需搭建服务器并编写大量后端代码,对于不熟悉后端的前端开发者来说,既耗时又耗精力。

无独有偶,发现 SQL to API 开源项目能帮我们解决这个问题,只需写 SQL 就能直接生成 REST API。

基于 Cloudflare Workers 和 D1 数据库实现,支持通过 Web 界面管理 API、参数化查询和实时测试,还内置了 SQL 注入防护。

GitHub: github.com/123xiao/Cloudflare-

主要功能:

- 零后端代码,纯 SQL 语句即可创建 API 接口;

- Web 可视化管理界面,支持 API 创建和测试;

- 参数化查询支持,可动态替换 SQL 中的参数值;

- 基于 Cloudflare 全球网络,响应速度超快;

- 内置安全防护,自动防范 SQL 注入攻击;

- API 调用日志记录,便于调试和监控。

提供了在线演示 Demo 体验,感兴趣的可本地安装并部署到 Cloudflare 使用。

:icon_weibo: weibo.com/5722964389/Pt2qypwli

来自微软开源的项目:Magentic-UI,提供了全新的人机协作网页自动化体验。

基于 AutoGen 框架的多智能体系统,能够让我们与 AI 助手协作完成复杂网页任务,既保持了自动化效率又确保了人工控制权。

GitHub: github.com/microsoft/magentic-

主要特性:

- 协作规划功能,与 AI 共同制定和编辑任务执行步骤;

- 实时任务监控,可随时中断并指导 AI 的执行过程 ;

- 敏感操作保护,重要动作需要人工确认才能执行;

- 智能计划学习,从历史任务中学习并自动优化未来执行;

- 并行任务处理,同时运行多个任务并显示状态指示器;

- 多智能体协作,包含网页操作、代码执行、文件处理等专业助手。

需要配置 OpenAI API 密钥使用,适合需要处理复杂网页任务的自动化场景。

:icon_weibo: weibo.com/5722964389/Pt1fusAHD

开发 AI 应用时,经常需要集成各种 MCP 服务器来扩展功能,但网上找到的实现往往零散分布,很难知道哪些好用、哪些适合自己的需求。

面对这个痛点,MCP Registry 开源项目提供了一个中心化的注册表服务,帮我们发现和管理 MCP 服务器。

通过 RESTful API 提供完整的服务器条目管理功能,包括列表查询、详情获取、发布更新等操作,还支持分页和健康监控。

GitHub: github.com/modelcontextprotoco

主要功能:

- 中心化的 MCP 服务器注册表,方便发现各种实现;

- RESTful API 支持服务器条目的增删改查操作;

- 分页查询和详细信息获取,快速找到合适的服务器;

- 集成一键发布功能,开发者可轻松分享自己的 MCP 实现;

- 健康检查端点,确保服务稳定运行;

- 支持 MongoDB 和内存数据库,灵活部署。

提供 Docker 一键部署方式,简单配置即可使用,适合正在使用 MCP 服务器的开发者。

:icon_weibo: weibo.com/5722964389/Pt0gC41ur

平时下载大文件时,传统下载工具不仅速度慢,还经常因为网络问题中断,重新开始下载挺让人头疼的。

在 GitHub 上发现来自一位高三学生开源的项目:Ghost Downloader 3,解决了我们这个痛点。

它能像 IDM 一样智能分块下载但无需合并文件,还配备了 AI 智能加速功能,让下载变得既快速又稳定。

GitHub: github.com/XiaoYouChR/Ghost-Do

主要功能:

- AI 智能加速,显著提升下载速度;

- 智能分块下载,无需手动合并文件;

- 多线程并发下载,充分利用网络带宽;

- 计划任务功能,支持定时下载管理;

- 浏览器插件优化,一键添加下载任务。

跨平台支持 Linux、Windows、macOS 三大系统,可在发布页下载开箱即用安装包。

:icon_weibo: weibo.com/5722964389/PsYTmEdqw

平时用 AI 工具积累了一堆 Prompt,但真要用的时候总是想不起来放哪了,每次还得复制粘贴,颇为麻烦。

此时,可以尝试使用 MCP Prompt Server 这款 MCP 服务器,把我们常用的 Prompt 变成了可调用的工具,告别复制粘贴。

它将每个 Prompt 模板注册为 MCP 工具,支持自然语言调用,还能在 Raycast、Cursor、Windsurf 等工具中通用。

GitHub: github.com/joeseesun/mcp-promp

主要功能:

- 丰富的内置 Prompt 模板,涵盖代码、写作、产品设计等场景;

- 所有 Prompt 自动注册为工具,支持参数化调用;

- 支持热加载,无需重启即可添加新 Prompt;

- 只需添加 YAML 文件即可扩展新功能;

- 适配 Raycast、Cursor、Windsurf 等主流编辑器;

- 自然语言对话即可调用,还能组合多个工具实现复杂工作流。

通过 npm install 安装后配置到 MCP 客户端即可使用。

:icon_weibo: weibo.com/5722964389/PsT03vbcB

每次开发完新项目,构建文档介绍站点颇为麻烦,可以试下这个开源的文档框架:Fumadocs,简洁灵活快速搭建。

基于 Next.js 开发,集成了 App Router 路由跳转,支持 MDX、内容集合和各种 CMS,帮我们快速搭建精美的文档网站。

GitHub: github.com/fuma-nama/fumadocs

此外,还内置全文搜索、代码高亮和主题切换等功能,并提供 CLI 工具,可一条命令即可创建新项目。

项目完全开源,提供了详细的文档介绍,可通过 Vercel 等平台快速部署。

:icon_weibo: weibo.com/5722964389/PsQQ6AfSf

Show older
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。