微软在 GitHub 上开源的一个项目:Qlib,可能是目前业内最完整的 AI 量化投资平台,截止目前已狂揽 20k+ 星。
基于强大的数据处理引擎和丰富的模型库,涵盖监督学习、强化学习等多种范式,让我们能快速构建从想法到生产的完整量化研究流程。
GitHub: https://github.com/microsoft/qlib
主要特性:
- 高效数据服务器,处理速度比传统数据库快几十倍;
- 集成 30+ 种 SOTA 量化模型,包括 Transformer、LSTM、LightGBM 等;
- 支持强化学习交易策略,可建模连续投资决策过程;
- 完整的投资链条覆盖:因子挖掘、风险建模、组合优化、订单执行;
- 提供自动化研究工具 qrun,一键完成建模到回测全流程;
- 支持市场动态适应和概念漂移处理,提升模型稳定性。
项目提供详细部署安装使用教程,适合想要做金融 AI 的开发者研究学习。
想要深入学习 AI 智能体的构建,可以看下 Master AI Agentic Engineering 这门开源课程。
通过通过 6 周完整学习计划,使用 OpenAI Agents SDK、CrewAI、LangGraph、AutoGen 和 MCP 等主流框架,从零开始构建真正的自主 AI 智能体。
GitHub: https://github.com/ed-donner/agents
包含了丰富的实践项目和代码示例,采用理论与实践相结合方式,从基础概念到高级应用。
并且提供 Windows、macOS 和 Linux 系统完整的环境配置指南。
环境配置好即可开始学习,适合想要系统掌握 AI 智能体工程的初学者。
在电脑和手机之间传个文字、图片或文件,常常打开微信发给自己,或者用各种云盘中转,颇为麻烦。
跟大家分享 GitHub 上一款好用的多设备剪贴板开源工具:SyncClipboard 。
它通过服务器同步各设备的剪贴板内容,支持文字、图片和文件,还能解决从浏览器复制动态图变静态的问题,甚至能自动转换图片格式。
GitHub: https://github.com/Jeric-X/SyncClipboard
主要功能:
- 多设备剪贴板实时同步,支持文字、图片和文件;
- 从浏览器复制图片时自动下载原图,保留动态图效果;
- 智能图片格式转换,解决不同应用间的兼容性问题;
- 支持 WebDAV 网盘作为服务器,也可独立部署;
- iOS 通过快捷指令、Android 通过多种工具实现同步;
- 支持自动提取并同步短信验证码。
服务器支持 Docker 一键部署,提供全平台桌面客户端,并内置了服务器功能,有需要的可以试下。
GitHub 上一份学术资源中文翻译合集:gpt-translated-pdf-zh,学习路上的宝藏库。
整理了众多计算机科学、数学、机器学习领域的经典教材中文翻译版,涵盖从基础算法到前沿 AI 技术的各个方面。
GitHub: https://github.com/it-ebooks-0/gpt-translated-pdf-zh
所有资料都是 PDF 格式,下载后即可离线阅读,值得看下有没有你在寻找的资料中文翻译版。
在 GitHub 上发现一个集成多个 Agent 的 DeepResearch 开源项目:DeepResearchAgent,从官方给的 GAIA 基准测试得分中,看到大幅超越 OpenAI Deep Research。
它采用的是分层架构,顶层负责任务规划分解,底层自动分配给专业的智能体执行深度分析、研究和浏览器自动化操作。
GitHub: https://github.com/SkyworkAI/DeepResearchAgent
主要特性:
- 智能任务分解,自动将复杂任务拆分为可执行步骤;
- 深度分析代理,提取关键信息和潜在需求;
- 深度研究代理,自动生成研究报告和知识摘要 ;
- 浏览器自动化,支持网页搜索和数据收集;
- 多智能体协作,动态协调各代理高效执行;
- 可扩展架构,支持集成更多专业化代理。
通过本地部署运行,并配置 API 密钥即可使用,对 DeepResearch 感兴趣的开发者可以看下这个项目。
在终端里执行命令遇到报错或需要帮助时,经常在浏览器和终端之间来回切换,很是折腾。
不妨试下 OpenCode 这款终端 AI 助手,让我们可以直接在命令行里获得 AI 的帮助,无需离开当前工作环境。
基于 Go 语言开发,支持 OpenAI、Claude、Gemini 等主流 AI 模型,还能直接操作文件、执行命令和分析项目代码。
GitHub: https://github.com/sst/opencode
主要功能:
- 终端 UI 界面,遇到问题立即获得 AI 帮助;
- 支持 OpenAI、Claude、Gemini 等多种 AI 提供商 ;
- 集成文件查看、代码分析、bash 命令执行等工具;
- 会话管理和持久化存储,保存对话历史;
- LSP 协议支持,提供代码智能诊断和建议;
- MCP 协议集成,可扩展外部工具和服务。
通过脚本一键安装或使用 Homebrew 安装即可,适合经常需要在终端上工作的开发者。
在处理 PDF 文档,想提取里面的文字、表格或图片特别麻烦,不同的库有不同的用法,经常要写一堆重复代码。
ParseStudio 这个 Python 库把各种解析器统一封装起来,只需用几行代码就能搞定 PDF 解析。
同时集成了 Docling、PyMuPDF 和 Llama Parse 三种解析引擎,可以根据需求灵活切换,无论是提取文本、表格还是图片都很方便。
GitHub: https://github.com/chatclimate-ai/ParseStudio
主要特性:
- 模块化设计,可在多种解析器间自由切换;
- 多模态解析,同时提取文本、表格和图片;
- API 设计简洁,几行代码完成复杂解析任务;
- 表格自动转换为 Markdown 格式,便于后续处理;
- 图片提取包含页码、位置等元数据信息;
- 支持批量处理多个 PDF 文件。
适合熟悉 Python 代码以及需批量处理 PDF 文档的开发者使用。
GitHub 上一个开源项目 Streaming-KokoroJS,能让文本转语音完全在浏览器本地运行,开源免费且保护隐私!
基于 Kokoro-82M 模型,实现在浏览器中实时生成高质量语音,并支持多种语音风格、WebGPU 加速和流式播放。
GitHub: https://github.com/rhulha/StreamingKokoroJS
主要功能:
- 100% 本地处理,无需上传文本到服务器;
- WebGPU 自动加速,没有也能用 WASM 运行;
- 智能文本分块,保持自然语音节奏;
- 支持多种语音风格,适应不同语言需求;
- 流式音频生成,边转换边播放不卡顿;
- 可下载生成的音频文件到本地保存。
首次打开网页,会下载一个约 300M 模型,下载完成后即可使用,适合比较重视数据隐私的创作者。
开发项目想要快速搭建数据 API,传统方式需搭建服务器并编写大量后端代码,对于不熟悉后端的前端开发者来说,既耗时又耗精力。
无独有偶,发现 SQL to API 开源项目能帮我们解决这个问题,只需写 SQL 就能直接生成 REST API。
基于 Cloudflare Workers 和 D1 数据库实现,支持通过 Web 界面管理 API、参数化查询和实时测试,还内置了 SQL 注入防护。
GitHub: https://github.com/123xiao/Cloudflare-SQL-to-API
主要功能:
- 零后端代码,纯 SQL 语句即可创建 API 接口;
- Web 可视化管理界面,支持 API 创建和测试;
- 参数化查询支持,可动态替换 SQL 中的参数值;
- 基于 Cloudflare 全球网络,响应速度超快;
- 内置安全防护,自动防范 SQL 注入攻击;
- API 调用日志记录,便于调试和监控。
提供了在线演示 Demo 体验,感兴趣的可本地安装并部署到 Cloudflare 使用。
来自微软开源的项目:Magentic-UI,提供了全新的人机协作网页自动化体验。
基于 AutoGen 框架的多智能体系统,能够让我们与 AI 助手协作完成复杂网页任务,既保持了自动化效率又确保了人工控制权。
GitHub: https://github.com/microsoft/magentic-ui
主要特性:
- 协作规划功能,与 AI 共同制定和编辑任务执行步骤;
- 实时任务监控,可随时中断并指导 AI 的执行过程 ;
- 敏感操作保护,重要动作需要人工确认才能执行;
- 智能计划学习,从历史任务中学习并自动优化未来执行;
- 并行任务处理,同时运行多个任务并显示状态指示器;
- 多智能体协作,包含网页操作、代码执行、文件处理等专业助手。
需要配置 OpenAI API 密钥使用,适合需要处理复杂网页任务的自动化场景。
开发 AI 应用时,经常需要集成各种 MCP 服务器来扩展功能,但网上找到的实现往往零散分布,很难知道哪些好用、哪些适合自己的需求。
面对这个痛点,MCP Registry 开源项目提供了一个中心化的注册表服务,帮我们发现和管理 MCP 服务器。
通过 RESTful API 提供完整的服务器条目管理功能,包括列表查询、详情获取、发布更新等操作,还支持分页和健康监控。
GitHub: https://github.com/modelcontextprotocol/registry
主要功能:
- 中心化的 MCP 服务器注册表,方便发现各种实现;
- RESTful API 支持服务器条目的增删改查操作;
- 分页查询和详细信息获取,快速找到合适的服务器;
- 集成一键发布功能,开发者可轻松分享自己的 MCP 实现;
- 健康检查端点,确保服务稳定运行;
- 支持 MongoDB 和内存数据库,灵活部署。
提供 Docker 一键部署方式,简单配置即可使用,适合正在使用 MCP 服务器的开发者。
平时下载大文件时,传统下载工具不仅速度慢,还经常因为网络问题中断,重新开始下载挺让人头疼的。
在 GitHub 上发现来自一位高三学生开源的项目:Ghost Downloader 3,解决了我们这个痛点。
它能像 IDM 一样智能分块下载但无需合并文件,还配备了 AI 智能加速功能,让下载变得既快速又稳定。
GitHub: https://github.com/XiaoYouChR/Ghost-Downloader-3
主要功能:
- AI 智能加速,显著提升下载速度;
- 智能分块下载,无需手动合并文件;
- 多线程并发下载,充分利用网络带宽;
- 计划任务功能,支持定时下载管理;
- 浏览器插件优化,一键添加下载任务。
跨平台支持 Linux、Windows、macOS 三大系统,可在发布页下载开箱即用安装包。
平时用 AI 工具积累了一堆 Prompt,但真要用的时候总是想不起来放哪了,每次还得复制粘贴,颇为麻烦。
此时,可以尝试使用 MCP Prompt Server 这款 MCP 服务器,把我们常用的 Prompt 变成了可调用的工具,告别复制粘贴。
它将每个 Prompt 模板注册为 MCP 工具,支持自然语言调用,还能在 Raycast、Cursor、Windsurf 等工具中通用。
GitHub: https://github.com/joeseesun/mcp-prompt-server
主要功能:
- 丰富的内置 Prompt 模板,涵盖代码、写作、产品设计等场景;
- 所有 Prompt 自动注册为工具,支持参数化调用;
- 支持热加载,无需重启即可添加新 Prompt;
- 只需添加 YAML 文件即可扩展新功能;
- 适配 Raycast、Cursor、Windsurf 等主流编辑器;
- 自然语言对话即可调用,还能组合多个工具实现复杂工作流。
通过 npm install 安装后配置到 MCP 客户端即可使用。
每次开发完新项目,构建文档介绍站点颇为麻烦,可以试下这个开源的文档框架:Fumadocs,简洁灵活快速搭建。
基于 Next.js 开发,集成了 App Router 路由跳转,支持 MDX、内容集合和各种 CMS,帮我们快速搭建精美的文档网站。
GitHub: https://github.com/fuma-nama/fumadocs
此外,还内置全文搜索、代码高亮和主题切换等功能,并提供 CLI 工具,可一条命令即可创建新项目。
项目完全开源,提供了详细的文档介绍,可通过 Vercel 等平台快速部署。
GitHub 上一款跨平台的即时通讯系统:HuLa。
基于 Tauri、Vue 3 和 TypeScript 构建,提供轻量、安全的即时通讯体验,兼容 Windows、macOS、Linux 等系统。
GitHub: https://github.com/HuLaSpark/HuLa
主要功能:
- 完整的即时通讯体验:一对一私聊、群组聊天、消息撤回、 @提醒等
- 丰富的消息类型支持:文字、表情包、文件传输、链接预览卡片
- 现代化界面设计:深色/浅色主题切换、自定义皮肤、多窗口管理
- 智能的联系人管理:好友在线状态、群组管理、免打扰、拉黑屏蔽
- 系统级集成:系统托盘、消息通知、托盘闪烁提醒、自动更新
- AI 助手集成(进行中):支持 DeepSeek、ChatGPT、Claude 等多种模型
所有代码已经开源,并提供了开箱即用的安装包,有需要的可以试下。
GitHub 上一款强大的 B 站历史记录分析工具:BiliHistoryFrontend,全方位分析我们在 B 站观看习惯,并生成超详细的数据报告。
基于 Vue 3 开发,不仅可以统计观看时长、生成年度总结,还支持本地视频摘要生成和一键下载所有视频,甚至能分析标题关键词和观看完成率。
GitHub: https://github.com/2977094657/BiliHistoryFrontend
通过 Docker 一键部署,提供了可视化操作界面,轻松上手使用,想要深入了解自己在 B 站使用习惯可以试下这款工具。
软件工程师想转型 AI 工程师,如果觉得迷茫不知从何下手,可以看下 AI Engineering Transition Path 这份学习资料。
系统化整理了所需了解的核心论文资源,并按从基础到高级进行分类,涵盖了从 Tokenization、Transformer 架构到 RLHF、SSM 等前沿技术。
GitHub: https://github.com/InterviewReady/ai-engineering-resources
并且还收录了各大公司如 Netflix、Uber、OpenAI 的实际落地应用案例,为我们提供了清晰学习路径。
适合有一定编程基础、想系统化转型到 AI 领域的开发者学习查看。
如果我们想要深入了解 OpenAI 的 Deep Research 底层工作原理,可以看下这个 nanoDeepResearch 开源项目。
作者受到字节开源的 DeerFlow 启发,决定从零开始构建一个深度研究 Agents,不依赖任何现有的框架,如 LangGraph。
通过该项目,我们可以清晰了解到工作流程中每个步骤,例如:
- 对于网络搜索,LLM 建议搜索什么内容;
- 对于编码,LLM 生成了什么代码;
- 对于规划,LLM 输出了什么研究计划。
GitHub: https://github.com/liyuan24/nanoDeepResearch
主要包含了以下内容:
- 完整实现 ReAct 代理系统,能自主推理和行动;
- 多专家协作系统,包括规划者、研究者、编码者和报告者;
- 透明展示每个步骤的决策过程和生成内容;
- 支持网络搜索、网页爬取和 Python 编程工具。
只需配置 OpenAI、Claude、Tavily 和 Jina 的 API 密钥,通过简单命令即可运行。
如果我们想要深入了解 OpenAI 的 Deep Research 底层工作原理,可以看下这个 nanoDeepResearch 开源项目。
作者受到字节开源的 DeerFlow 启发,决定从零开始构建一个深度研究 Agents,不依赖任何现有的框架,如 LangGraph。
通过该项目,我们可以清晰了解到工作流程中每个步骤,例如:
- 对于网络搜索,LLM 建议搜索什么内容;
- 对于编码,LLM 生成了什么代码;
- 对于规划,LLM 输出了什么研究计划。
GitHub: https://github.com/liyuan24/nanoDeepResearch
主要包含了以下内容:
- 完整实现 ReAct 代理系统,能自主推理和行动;
- 多专家协作系统,包括规划者、研究者、编码者和报告者;
- 透明展示每个步骤的决策过程和生成内容;
- 支持网络搜索、网页爬取和 Python 编程工具。
只需配置 OpenAI、Claude、Tavily 和 Jina 的 API 密钥,通过简单命令即可运行。
GitHub 上一份颇为全面的 AI 工程学习资源合集:Learn AI Engineering。
涵盖从数学基础到前沿 AI 技术应用的完整免费学习资源,并且按视频教程、在线课程、必读论文等分类整理。
GitHub: https://github.com/ashishps1/learn-ai-engineering
提供了相对完整的学习参考路径,从基础数学、Python、深度学习到生成式 AI、大语言模型、RAG、MCP 和 AI Agents,构建了清晰的进阶路线。
适合 AI 初学者和想要系统化学习 AI 工程的开发者,这份资料给了个参考,无需再四处搜索资料。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报