分享 GitHub 上一个专为开发者准备的 YouTube 视频信息提取工具:YouTube Tools API Server。
这个基于 FastAPI 构建的服务器提供了简便的接口,可以轻松获取视频元数据、字幕和带时间戳的转录文本,特别适合需要处理 YouTube 内容的应用开发。
GitHub: https://github.com/zaidmukaddam/youtube-api-server
主要功能:
- 获取视频元数据(标题、作者、缩略图等)
- 提取视频字幕/转录文本
- 生成带时间戳的转录文本
- 支持多语言字幕提取
- 提供清晰且符合 RESTful 规范的 API 设计
安装简便,只需克隆代码库并安装依赖,通过 Python 运行即可启动服务器。支持通过环境变量自定义端口和主机设置。
分享 GitHub 上一款安全且本地化的 AI 桌面应用:Klee。
这款应用内置 RAG 知识库和 Markdown 笔记支持,让我们能在本地运行开源大模型,完全离线使用且零数据收集,保护隐私安全。
GitHub: https://github.com/signerlabs/klee-client
主要特性:
- 可下载并在桌面运行开源 LLM 模型
- 完全离线使用,零数据收集,保障隐私安全
- 内置 Markdown 笔记功能,便于记录和整理思路
- 支持文件和文件夹知识库,建立个性化 AI 助手
- 基于 Ollama 和 LlamaIndex 构建,运行快速高效
提供各平台安装包,直接下载安装即可使用,也支持从源码构建安装。
分享 GitHub 上一款强大的 ComfyUI 背景移除插件:ComfyUI-RMBG。
支持物体、人脸、服装和时尚元素的精准分割,整合了多种先进模型包括 RMBG-2.0、BiRefNet、SAM 等。
GitHub: https://github.com/1038lab/ComfyUI-RMBG
除此之外,还支持批量处理、可自由调整敏感度、分辨率、模糊度等参数。
可通过 ComfyUI-Manager 搜索安装,或直接克隆到 custom_nodes 文件夹中,首次使用时会自动下载所需模型。
分享一个网站集成了 100+ 主流 MCP 服务的列表:Composio MCP Server。
涵盖了人工智能、市场营销、生产力管理、设计创意、数据分析、文件管理等等不同领域。
链接: 网页链接
同时还提供了相应的安装步骤,可应用于 Cursor、Claude、Windsurf 等 AI 工具。
分享 GitHub 上一款轻量级、高性能的开源 JavaScript 思维导图工具:Mind Elixir。
可在任何前端框架中使用,支持拖放编辑、导出多种格式、插件化扩展、批量操作等功能。
GitHub: https://github.com/ssshooter/mind-elixir-core
除此之外,还支持撤销/重做、快捷键和自定义主题,可通过 CSS 变量轻松样式化节点,极其灵活易用。
来自斯坦福大学,在 GitHub 上开源的一款创新型 AI 写作工具:STORM。
只需输入一个写作主题,它便能自动帮我们深挖资料,从多个角度收集大量参考信息,并生成大纲。
甚至,它还会模拟一位资深专家与我们进行问答对话,并结合联网搜索资源深入了解主题。
最后,逐步完成整篇文章的撰写且附带引用,并且可一键下载 PDF 保存到本地。
GitHub: https://github.com/stanford-oval/storm
在线体验:storm.genie.stanford.edu
有了这个 AI 工具,相信你也能编写出类似维基百科那种具有深度和广度的文章!
不过目前 STORM 仅支持英文输入,感兴趣的同学可以去体验下。 #AI创造营
分享 GitHub 上一个开源免费的图片上传工具:imgUU。
基于 Cloudflare D1 和 R2 构建,可轻松将图片上传到 Cloudflare 存储桶,为我们提供简单高效的图片托管解决方案。
GitHub: https://github.com/yestool/imgUU
提供简单易用界面,支持多种图片格式、上传记录管理以及 GitHub 登录管理等功能。
分享 GitHub 上一个适用于快速构建 AI 智能体的工具包:Composio。
集成了超过 250 种工具,包括 GitHub、Notion、Gmail 等软件,以及系统操作和全网搜索。
GitHub: https://github.com/composiohq/composio
支持主流 AI 框架,包括 OpenAI、Claude、LlamaIndex、Langchain 等。
提供 Python 和 JavaScript 安装依赖,简单几行代码,即可创建具备强大工具能力的 AI 智能体。
推荐 GitHub 上一款功能强大的文档自动化 AI 工具:Paperless-AI。
为 Paperless-ngx 文档管理系统提供 AI 的支持,可自动或手动分析文档,并添加元数据,包括标题、标签和分类等。
GitHub: https://github.com/clusterzx/paperless-ai
同时提供了与文档 AI 聊天功能,可以直接向文档进行提问。
支持 Ollama、OpenAI、DeepSeek、OpenRouter 等主流的 AI 模型提供商。
可通过 Docker 一键部署,配置简单,快速上手使用。 #AI创造营
在 GitHub 上发现一个开源的魔改版 Ollama:ollama-for-amd。
基于官方 Ollama 进行修改,增加对更多 AMD 显卡的支持,快速启动并运行 DeepSeek、Llama 3、Gemma 等大模型。
GitHub: https://github.com/likelovewant/ollama-for-amd
支持 gfx803、gfx908、gfx90c、gfx1011、gfx1032、gfx1100 等等 AMD 显卡。
完整支持的 AMD 显卡如下图。 #AI创造营
分享 GitHub 上一个适合屏幕阅读的开源免费字体:霞鹜文楷屏幕阅读版。
基于「霞鹜文楷」字体修改,调整了原版的字重以及度量数据,更适合电脑手机屏幕显示。
GitHub: https://github.com/lxgw/LxgwWenKai-Screen
如下图是与 Segoe UI 字体的搭配效果,感兴趣的可在 Releases 界面下载字体包。
分享 GitHub 上一款简洁且功能丰富的 AI 聊天桌面应用:Yogu。
基于 Tauri 和 Vue 3 构建,支持网络搜索、聊天历史管理、多语言、文件上传以及多主题切换等功能。
GitHub: https://github.com/xiaozi/yogu-chat-app
目前项目在快速迭代开发当中,已支持 Anthropic、OpenAI、Google 等 AI 模型提供商。
在 GitHub 上发现一个很有意思的开源项目:gfiles。
收录了将近百款,可以直接在浏览器上玩的经典 HTML 5 游戏,比如 2048、俄罗斯方块、贪吃蛇等。
GitHub: https://github.com/BinBashBanana
所有游戏的代码均已打包好并开源,可进行魔改增加关卡或难度。
分享 GitHub 上一款可离线使用的图像背景移除工具:background-removal-js。
基于 Node.js 开发,可在浏览器本地离线运行,轻松一键去除图像背景,且安全隐私。
GitHub: https://github.com/imgly/background-removal-js
此外,在代码上集成它也非常简单,只需 3 行代码即可,想做本地图像背景移除的可以试下。
分享 GitHub 上一个精心策划的推理大语言模型研究资源库:Awesome-LLM-Post-training。
收集了关于增强大语言模型推理能力的后训练方法论、论文、代码实现和基准测试,帮助研究人员和开发者深入了解如何打造高质量推理模型。
GitHub: https://github.com/mbzuai-oryx/Awesome-LLM-Post-training
内容涵盖强化学习、过程奖励模型、多步推理策略等关键技术领域的最新研究成果,并提供推理评估基准和开源训练框架的全面汇总。
想了解如何打造 R1/o1/Claude 这类推理模型的同学,可以看下这份资料整理。
分享 GitHub 上一款颇有意思的自定义仪表盘工具:Glance。
这是一个轻量级、高度可定制的个人仪表盘,可以在一个页面中同时查看多种信息源,包括 RSS 订阅、Reddit 帖子、YouTube 更新等内容。
GitHub: https://github.com/glanceapp/glance
同时,不仅提供各种实用组件,如天气、日历、时钟等,还支持多种布局、多页面/标签配置,响应式界面适配手机,并提供多种主题选择。
可通过 Docker 快速部署方式,配置简单,开箱即用。
分享 GitHub 上一款强大的终端 HTTP 客户端工具:Posting。
类似 Postman 和 Insomnia 的 HTTP 客户端,可通过 SSH 使用,并支持高效的键盘操作流程,所有请求以简单的 YAML 文件本地存储。
GitHub: https://github.com/darrenburns/posting
支持快速导航、环境变量设置、自动补全、语法高亮、Vim 快捷键、导入 curl 命令等等功能。
兼容 MacOS、Linux 和 Windows 系统安装使用,无需复杂配置,命令行直接运行。
分享 GitHub 上一个超低资源消耗超快的离线翻译服务器:MTranServer。
仅需 CPU + 1G 内存即可运行,无需 GPU,支持全世界主要语言的翻译,翻译质量与 Google 翻译相当。
GitHub: https://github.com/xxnuo/MTranServer
核心亮点就是可以本地离线使用翻译,且可以在配置非常低的电脑上运行。
提供了 Docker 快速部署方式,有需要的可以试下。 #AI创造营
又在 GitHub 上发现一款 Deep Research 开源平替:Shandu。
它利用 LLM 和网络爬虫技术,对任意主题进行全面研究,自动生成包含完整引用的综合报告,省去繁琐的手动资料收集工作。
GitHub: https://github.com/jolovicdev/shandu
核心特性:
- 迭代深入探索主题
- 智能评估信息源可靠性
- 多渠道信息整合分析
- 并行处理多查询架构
- 生成结构完善的研究报告
适用于学术研究、市场情报、内容创作、技术探索、政策分析和竞争分析等多种场景。
分享 GitHub 上一个收集了丰富 Logo 的 SVG 图标库:Super Tiny Icons。
目前已收集 386+ 个主流的品牌和产品的 Logo,如 GitHub、Twitter、Facebook 等等。
GitHub: https://github.com/edent/SuperTinyIcons
每个图标体积小,控制在 1kb 以下,同时保持高清和可无损缩放,适应各种尺寸需求。
除了可以直接使用,也可以导入到前端框架中使用,还可以在 Android 应用中使用。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报