分享 GitHub 上一款高颜值的在线开发工具箱:极速箱。
集成了各种程序员必备开发工具,如 JSON 处理、编码解码、网络测试等等,支持搜索快速找到所需工具。
GitHub: https://github.com/star7th/jisuxiang
除此之外,还支持收藏常用的工具,以及响应式设计,并提供深浅两种主题。
基于 Node.js. 开发,可通过 Docker 快速部署使用。
一份收集整理了大模型在不同领域的实际应用列表:Awesome LLM Apps。
涵盖了客服、法律、健康、旅游、数据分析等场景的智能体,以及结合 RGA(检索增强生成)和具备记忆功能的应用。
GitHub: https://github.com/Shubhamsaboo/awesome-llm-apps
此外,还有 LLM 微调、高级工具和框架使用教程等。并提供详细介绍,方便大家学习及部署运行。
来自国外开发者 Lee Boonstra 分享的一份超详细的提示词学习指南,值得每个人看下。
详细介绍了如何通过提示工程(Prompt Engineering)来有效地与大模型交互,以及如何编写提示词获得想要的输出。
包括对大模型输出配置的介绍,如输出长度、采样控制、温度值、Top-K 和 Top-P 选择等。
同时涵盖各种不同的提示词技术,包括通用 Prompt、上下文、角色提示、思维链(CoT)以及思维树(ToT)等等。
并且提供相关的代码示例和清楚的注释,以便大家更好地理解与实践。
PDF 文档地址: https:// 网页链接
一个基于 MCP 实现聊天记录总结和查询的开源工具:Chatlog,完美解决我们群聊消息过多没时间查看的问题。
提供简单易用的操作界面和命令行工具,支持微信 3.x 和 4.0 版本,实现查询聊天记录、联系人、群聊以及最近对话等信息。
GitHub: https://github.com/sjzar/chatlog
通过 MCP SSE 协议,可与任何支持 MCP 的 AI 助手集成使用,如 Claude、ChatWise、Cherry Studio 等。
分享 GitHub 上一份收集整理了视觉 RAG 领域的前沿论文和研究资源:Awesome-RAG-Vision。
涵盖视觉理解、视频理解、多模态和视觉生成等领域的前沿 RAG 论文,并进行了清晰的分类。
GitHub: https://github.com/zhengxuJosh/Awesome-RAG-Vision
不仅收集了大量高质量的论文,还包含各类教程资源,旨在帮助研究者快速了解该领域的最新进展。
给最近求职面试的同学推荐一款实用的开源工具:Self,一键构建精美网页版简历。
它能自动从我们上传的 PDF 简历中提取关键信息,一键生成精美的个人网站,无需编写代码,技术小白轻松上手。
GitHub: https://github.com/Nutlope/self.so
除此之外,还能够自定义编辑网站内容,并且提供多种主题切换,完成后点击发布,即可分享给他人访问阅读。
基于 Together AI + Upstash + AWS S3 等开发,提供详细本地部署指南,感兴趣的可以部署使用。
分享 GitHub 上一份专为中文用户精心整理的 MCP 资源合集:Awesome-MCP-ZH。
涵盖了 MCP 基础介绍、客户端工具、服务器精选列表和学习资源等内容,旨在帮助我们快速上手这个 AI 界的 “万能插头”。
GitHub: https://github.com/yzfly/Awesome-MCP-ZH
并提供了详细的 MCP 使用指南,小白也能轻松入门,建议 Cherry Studio(客户端) + 阿里 Qwen (大模型)组合,免费且易上手。
在众多 AI 知识库问答工具中,又有一款名为 “语析” 强大的知识库与知识图谱问答系统,脱颖而出。
结合了大模型 RAG 技术与知识图谱技术,让我们能通过自然对话智能检索文档知识并得到精准答案。
GitHub: https://github.com/xerrors/Yuxi-Know
主要特性:
- 支持多种大模型,包括 OpenAI、国内主流平台以及本地部署;
- 支持导入 PDF、TXT、MD 等多种格式文档到知识库;
- 集成 Neo4j 知识图谱,支持复杂知识关联查询;
- 支持网页检索并展示内容,提供多维度信息来源。
提供 Docker 快速部署方式,无需显卡也能运行,可视化配置界面,只需简单配置模型的 API_KEY 即可使用。
分享一份收集整理了众多 AI 工具系统提示词的合集:Awesome AI System Prompts。
包含了 Bolt.new、ChatGPT、Claude、Cline、Manus、perplexity.ai 等 AI 工具的系统提示词。
GitHub: https://github.com/dontriskit/awesome-ai-system-prompts
项目持续在更新,并提供清晰的文件,方便大家复制使用和查找学习。
又发现了一个轻量级、免费的在线视频搜索和观看平台:LibreTV。
无需注册、即开即用,整合了多个可靠有效的视频源,并提供视频搜索和在线播放功能,轻松追剧看电影。
GitHub: https://github.com/bestZwei/LibreTV
此外还内置广告过滤功能,同时采用响应式设计,适配电脑、平板和手机使用,观影体验直接飙升。
有需要的可通过 Vercel、Cloudflare、Docker 等多种一键部署使用。
推荐 GitHub 上一款强大的 PDF 文档分析开源工具:PDF Document Layout Analysis。
它能准确自动识别 PDF 页面中的文本、标题、图片、表格等元素,并确定它们的正确阅读顺序,大幅提升文档处理效率。
GitHub: https://github.com/huridocs/pdf-document-layout-analysis
主要功能:
- 高精度自动识别文档中的 11 种常见不同元素类型,如标题、图片、表格等;
- 提供高性能视觉模型和快速轻量级模型两种选择;
- 支持表格提取为 Markdown、LaTeX 或 HTML 格式;
- 支持公式提取为 LaTeX 格式;
- 通过 Tesseract OCR 支持 150+ 种语言的文本识别。
使用 Docker 快速部署,支持 GPU 加速,几行命令即可启动服务并开始分析 PDF 文档。
开发者经常需要查看技术文档,这不仅是一项既耗时又繁琐的工作。
为了解决这个痛点,一款专为程序员打造的文档爬取和处理工具:DevDocs,开源了!
它能够自动爬取、提取并组织技术文档,将以往需要花数周理解文档的时间缩短至几个小时,极大提升我们的开发效率。
GitHub: https://github.com/cyberagiinc/DevDocs
主要功能:
- 智能爬取功能,支持 1-5 层深度的网站结构爬取;
- 自动发现链接和子 URL,全面映射网站结构;
- 并行处理技术,实现高速文档爬取与智能缓存;
- 干净提取内容,去除冗余信息易于理解;
- 支持 MD 和 JSON 导出格式,方便 LLM 训练。
除此之外,还内置 MCP 服务器,支持集成到 Claude、Cursor、Cline 等 AI 应用,实现聊天对话查询文档。
提供 Docker 快速部署方式,简单配置下,即可使用。
又一款开源免费的文件分享工具:Palmr.,可作为 WeTransfer、SendGB 等工具的开源平替。
允许自托管部署,完全掌控数据,无需依赖第三方服务,没有文件大小限制,数据隐私且安全。
GitHub: https://github.com/kyantech/Palmr
并且提供可设置密码保护、自定义链接和访问权限等功能,确保分享自由。
提供了详细完整的部署文档,有需要的可以在自己的服务器上进行部署使用。
分享 GitHub 上一份精心整理的检索增强生成(RAG)技术资源集合:Awesome-RAG。
这份列表系统整理了 RAG 相关的理论知识、实现方法、开发框架、关键技术以及评估指标等内容。
GitHub: https://github.com/Danielskry/Awesome-RAG
从基本原理到高级技术详解,再到实现步骤,有助于我们更好学习与使用 RAG。
GitHub 上一款本地化 AI 视频翻译和配音的开源工具:KrillinAI。
简单易用且功能强大,集视频翻译、配音、语音克隆于一身,支持横竖屏格式,适配哔哩哔哩、抖音、YouTube 等多平台发布。
GitHub: https://github.com/krillinai/KrillinAI
主要功能:
- 一键启动,无需复杂环境配置,自动安装依赖
- 支持 yt-dlp 下载或本地视频文件上传
- 基于 Whisper 的高精度语音识别和自动字幕生成
- 使用 LLM 进行智能分段和专业翻译,保持语义连贯
- 提供 CosyVoice 精选音色或自定义音色克隆功能
- 自动处理横竖版视频和字幕排版,完美适配各平台
提供 Windows、macOS 和 Linux 安装包,以及支持 Docker 部署,简单配置后即可使用。
在 GitHub 上发现一个简单高效的 LLM 强化学习库:nanoAhaMoment。
仅需单个 80G GPU,无需 RL 库,使用 3B 基础模型,全参数微调,就能实现类似 DeepSeek R1-zero 的风格训练,而且整个过程只需不到 10 小时。
GitHub: https://github.com/McGill-NLP/nano-aha-moment
提供了 Jupyter notebook 笔记和通俗易懂的代码,并且附有详细教程视频,轻松上手学习。
推荐 GitHub 上一款专为机器学习优化的强大 OCR 工具:Versatile-OCR-Program,能精准提取复杂结构化数据。
支持多语言文本、数学公式、表格、图表和示意图的识别,并为提取的元素添加语义标注和上下文解释,适合制作高质量的 ML 训练数据集。
GitHub: https://github.com/ses4255/Versatile-OCR-Program
主要特性:
- 多语言支持,包括日语、韩语和英语,可扩展支持其他语言
- 支持 JSON 和 Markdown 格式输出,包含数学表达式、表格摘要和图像说明
- 准确处理包含密集科学内容和丰富视觉元素的考试风格 PDF
- 自动为视觉内容生成自然语言描述,增强下游模型训练效果
经过测试,在 EJU 生物学和东京大学数学等真实学术数据集上,达到 90-95% 的高准确率。
无论是使用 AI 对网页进行总结,还是针对 GitHub 仓库代码进行提问,我们都需要手动整合内容作为模型的上下文。
这个过程既繁琐又低效,为此 GitHub 上这款 OneFileLLM 开源工具提供了高效的数据聚合解决方案。
它能够自动将网页、GitHub 仓库、ArXiv 学术论文和 YouTube 视频等来源的内容提取并整合为单一文件,自动复制到剪贴板使用。
GitHub: https://github.com/jimmc414/onefilellm
主要功能:
- 支持 PDF、Jupyter Notebook 等多种文件格式的处理
- 内置网页爬取功能,可提取链接页面内容至指定深度
- 与 Sci-Hub 集成,可通过自动下载研究论文
- 文本预处理、标记计数和 XML 封装,提高 LLM 处理效率
使用简单,只需要输入 URL,工具就会自动检测来源并处理,非常高效,省时省力。
在分享超长的网页链接时,既不直观还缺乏数据统计,又或者临时注册一些不重要的网站不想使用真实邮箱。
如果有以上的需求,不妨试下这款强大的短链与临时邮箱多功能聚合工具:WR.DO。
不仅能生成附有访问者统计信息的短链接,还能创建与管理多个临时邮箱,此外还支持管理多个 DNS 记录、元数据抓取,权限管理等功能。
GitHub: https://github.com/oiov/wr.do
可通过 Vercel 一键部署,并基于 Cloudflare 服务,免费快速搭建使用。
给 AI 开发者分享一份值得收藏的学习资源合集:Learning AI。
涵盖了从基础理论到实践应用,包括分词技术、模型架构、GPU 加速、向量数据库、视觉技术等核心知识。
GitHub: https://github.com/danbev/learning-ai
不仅包含了详细的技术笔记,还提供大量实践代码示例,如 GGML、Llama.cpp、嵌入向量操作等。
项目目前在持续更新中,适合 AI 初学者或者想深入了解 AI 的开发者学习。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报