Show newer

分享一份收集整理了众多 AI 工具系统提示词的合集:Awesome AI System Prompts。

包含了 Bolt.new、ChatGPT、Claude、Cline、Manus、perplexity.ai 等 AI 工具的系统提示词。

GitHub: github.com/dontriskit/awesome-

项目持续在更新,并提供清晰的文件,方便大家复制使用和查找学习。

:icon_weibo: weibo.com/5722964389/PmusFvLWC

又发现了一个轻量级、免费的在线视频搜索和观看平台:LibreTV。

无需注册、即开即用,整合了多个可靠有效的视频源,并提供视频搜索和在线播放功能,轻松追剧看电影。

GitHub: github.com/bestZwei/LibreTV

此外还内置广告过滤功能,同时采用响应式设计,适配电脑、平板和手机使用,观影体验直接飙升。

有需要的可通过 Vercel、Cloudflare、Docker 等多种一键部署使用。

:icon_weibo: weibo.com/5722964389/PmtS8yWyw

推荐 GitHub 上一款强大的 PDF 文档分析开源工具:PDF Document Layout Analysis。

它能准确自动识别 PDF 页面中的文本、标题、图片、表格等元素,并确定它们的正确阅读顺序,大幅提升文档处理效率。

GitHub: github.com/huridocs/pdf-docume

主要功能:

- 高精度自动识别文档中的 11 种常见不同元素类型,如标题、图片、表格等;

- 提供高性能视觉模型和快速轻量级模型两种选择;

- 支持表格提取为 Markdown、LaTeX 或 HTML 格式;

- 支持公式提取为 LaTeX 格式;

- 通过 Tesseract OCR 支持 150+ 种语言的文本识别。

使用 Docker 快速部署,支持 GPU 加速,几行命令即可启动服务并开始分析 PDF 文档。

:icon_weibo: weibo.com/5722964389/PmsTfAX62

开发者经常需要查看技术文档,这不仅是一项既耗时又繁琐的工作。

为了解决这个痛点,一款专为程序员打造的文档爬取和处理工具:DevDocs,开源了!

它能够自动爬取、提取并组织技术文档,将以往需要花数周理解文档的时间缩短至几个小时,极大提升我们的开发效率。

GitHub: github.com/cyberagiinc/DevDocs

主要功能:

- 智能爬取功能,支持 1-5 层深度的网站结构爬取;

- 自动发现链接和子 URL,全面映射网站结构;

- 并行处理技术,实现高速文档爬取与智能缓存;

- 干净提取内容,去除冗余信息易于理解;

- 支持 MD 和 JSON 导出格式,方便 LLM 训练。

除此之外,还内置 MCP 服务器,支持集成到 Claude、Cursor、Cline 等 AI 应用,实现聊天对话查询文档。

提供 Docker 快速部署方式,简单配置下,即可使用。

:icon_weibo: weibo.com/5722964389/Pmrw17ViL

又一款开源免费的文件分享工具:Palmr.,可作为 WeTransfer、SendGB 等工具的开源平替。

允许自托管部署,完全掌控数据,无需依赖第三方服务,没有文件大小限制,数据隐私且安全。

GitHub: github.com/kyantech/Palmr

并且提供可设置密码保护、自定义链接和访问权限等功能,确保分享自由。

提供了详细完整的部署文档,有需要的可以在自己的服务器上进行部署使用。

:icon_weibo: weibo.com/5722964389/PmkrEf8xF

分享 GitHub 上一份精心整理的检索增强生成(RAG)技术资源集合:Awesome-RAG。

这份列表系统整理了 RAG 相关的理论知识、实现方法、开发框架、关键技术以及评估指标等内容。

GitHub: github.com/Danielskry/Awesome-

从基本原理到高级技术详解,再到实现步骤,有助于我们更好学习与使用 RAG。

:icon_weibo: weibo.com/5722964389/PmjsL9sjB

GitHub 上一款本地化 AI 视频翻译和配音的开源工具:KrillinAI。

简单易用且功能强大,集视频翻译、配音、语音克隆于一身,支持横竖屏格式,适配哔哩哔哩、抖音、YouTube 等多平台发布。

GitHub: github.com/krillinai/KrillinAI

主要功能:

- 一键启动,无需复杂环境配置,自动安装依赖

- 支持 yt-dlp 下载或本地视频文件上传

- 基于 Whisper 的高精度语音识别和自动字幕生成

- 使用 LLM 进行智能分段和专业翻译,保持语义连贯

- 提供 CosyVoice 精选音色或自定义音色克隆功能

- 自动处理横竖版视频和字幕排版,完美适配各平台

提供 Windows、macOS 和 Linux 安装包,以及支持 Docker 部署,简单配置后即可使用。

:icon_weibo: weibo.com/5722964389/Pmi5wfM0p

在 GitHub 上发现一个简单高效的 LLM 强化学习库:nanoAhaMoment。

仅需单个 80G GPU,无需 RL 库,使用 3B 基础模型,全参数微调,就能实现类似 DeepSeek R1-zero 的风格训练,而且整个过程只需不到 10 小时。

GitHub: github.com/McGill-NLP/nano-aha

提供了 Jupyter notebook 笔记和通俗易懂的代码,并且附有详细教程视频,轻松上手学习。

:icon_weibo: weibo.com/5722964389/PmhIfi3G5

推荐 GitHub 上一款专为机器学习优化的强大 OCR 工具:Versatile-OCR-Program,能精准提取复杂结构化数据。

支持多语言文本、数学公式、表格、图表和示意图的识别,并为提取的元素添加语义标注和上下文解释,适合制作高质量的 ML 训练数据集。

GitHub: github.com/ses4255/Versatile-O

主要特性:

- 多语言支持,包括日语、韩语和英语,可扩展支持其他语言

- 支持 JSON 和 Markdown 格式输出,包含数学表达式、表格摘要和图像说明

- 准确处理包含密集科学内容和丰富视觉元素的考试风格 PDF

- 自动为视觉内容生成自然语言描述,增强下游模型训练效果

经过测试,在 EJU 生物学和东京大学数学等真实学术数据集上,达到 90-95% 的高准确率。

:icon_weibo: weibo.com/5722964389/Pmccd09pv

无论是使用 AI 对网页进行总结,还是针对 GitHub 仓库代码进行提问,我们都需要手动整合内容作为模型的上下文。

这个过程既繁琐又低效,为此 GitHub 上这款 OneFileLLM 开源工具提供了高效的数据聚合解决方案。

它能够自动将网页、GitHub 仓库、ArXiv 学术论文和 YouTube 视频等来源的内容提取并整合为单一文件,自动复制到剪贴板使用。

GitHub: github.com/jimmc414/onefilellm

主要功能:

- 支持 PDF、Jupyter Notebook 等多种文件格式的处理

- 内置网页爬取功能,可提取链接页面内容至指定深度

- 与 Sci-Hub 集成,可通过自动下载研究论文

- 文本预处理、标记计数和 XML 封装,提高 LLM 处理效率

使用简单,只需要输入 URL,工具就会自动检测来源并处理,非常高效,省时省力。

:icon_weibo: weibo.com/5722964389/Pmb19d6Up

在分享超长的网页链接时,既不直观还缺乏数据统计,又或者临时注册一些不重要的网站不想使用真实邮箱。

如果有以上的需求,不妨试下这款强大的短链与临时邮箱多功能聚合工具:WR.DO。

不仅能生成附有访问者统计信息的短链接,还能创建与管理多个临时邮箱,此外还支持管理多个 DNS 记录、元数据抓取,权限管理等功能。

GitHub: github.com/oiov/wr.do

可通过 Vercel 一键部署,并基于 Cloudflare 服务,免费快速搭建使用。

:icon_weibo: weibo.com/5722964389/Pma2gzZJq

给 AI 开发者分享一份值得收藏的学习资源合集:Learning AI。

涵盖了从基础理论到实践应用,包括分词技术、模型架构、GPU 加速、向量数据库、视觉技术等核心知识。

GitHub: github.com/danbev/learning-ai

不仅包含了详细的技术笔记,还提供大量实践代码示例,如 GGML、Llama.cpp、嵌入向量操作等。

项目目前在持续更新中,适合 AI 初学者或者想深入了解 AI 的开发者学习。

:icon_weibo: weibo.com/5722964389/Pm8F1pPNm

分享 GitHub 上一份全面且详细的本地 LLM 服务器搭建指南:Local LLaMA Server Setup Documentation。

包含推理引擎、聊天平台、语音合成和文生图等功能,所有数据都在本地处理,且不依赖任何云服务。

GitHub: github.com/varunvasudeva1/llm-

提供从零开始的搭建全流程详细教程,并支持 Nvidia 和 AMD GPU,适合新手学习。

:icon_weibo: weibo.com/5722964389/Plzja6YPu

在阅读外语学术论文时,我们往往需要在翻译软件和原文之间来回切换,颇为耗时。

给大家推荐 GitHub 上一个强大的 PDF 科学论文翻译工具:BabelDOC。

它能在保留原文排版的同时提供双语对照,支持复杂论文中的数学公式、表格和图形。

GitHub: github.com/funstory-ai/BabelDO

安装使用简单,并提供易用的命令行界面,同时可使用兼容 OpenAI 模型翻译接口。

此外,如果不想部署,也可使用其在线服务,每月可免费翻译 1000 页。

:icon_weibo: weibo.com/5722964389/Plykhchij

每天面对铺天盖地的前沿 AI 信息,我们很难筛选出真正重要的内容,更别说理解其中的意义了。

开源工具 Meridian 为解决这一困境而生,它利用 AI 从数百个新闻源中抓取内容、分析信息,并为我们提供个性化的每日简报。

GitHub: github.com/iliane5/meridian

实现原理如下:

  1. 抓取:通过 Cloudflare Workers 获取多个 RSS 源的内容并存储元数据;

  2. 处理:提取文章文本,使用 Gemini AI 分析内容相关性和结构;

  3. 简报生成:对文章进行聚类,生成分析,合成最终简报;

  4. 前端展示:通过 Nuxt/Cloudflare 平台展示简报内容。

项目提供完整部署指南,需要相关的 API 密钥,开发者感兴趣的可以试试。

:icon_weibo: weibo.com/5722964389/PlwX2eccK

又发现一款功能强大的开源 AI 搜索工具:OpenDeepSearch。

在简单的查询上(SimpleQA)与 GPT-4o Search 效果相当,而在复杂的查询(FRAMES)上甚至大幅超越了它。

GitHub: github.com/sentient-agi/OpenDe

主要功能:

- 语义搜索:利用 Crawl4AI 和语义搜索重排模型提供深度搜索结果;

- 提供两种模式:默认模式(快速高效)和专业模式(更深入精确);

- 专为 AI 智能体优化,与 SmolAgents(如 CodeAgent)无缝协作;

- 可扩展性:易于配置,可与不同模型和 API 一起使用。

同时具备高度可扩展性,可以配置与不同模型和 API 一起使用。

:icon_weibo: weibo.com/5722964389/PlvnClzFJ

在写文章或教程时,我们经常需要插入大量的图片和文件,往往需要一个稳定且不限大小的图床。

推荐 GitHub 上一个基于 CloudFlare Pages 的开源免费文件托管解决方案:CloudFlare ImgBed,可作为图床、文件床、网盘。

提供上传、管理、读取、删除等全链路功能,并支持鉴权、目录、图片审查、随机图等各项特性。

GitHub: github.com/MarSeventh/CloudFla

主要特性:

- 支持多种存储渠道(Telegram Bot、Cloudflare R2、S3 等)与多种上传方式

- 支持目录功能、上传认证、图片审查、防滥用与 IP 黑名单

- 提供丰富 API 接口,包含上传 API 与随机图 API

- 可自定义网站外观、背景、图床名称、Logo 等界面元素

- 完全基于 Cloudflare 免费额度,无需额外购买服务器和域名

项目提供了详细的部署教程,可根据自己需求进行部署与配置。

:icon_weibo: weibo.com/5722964389/PloTMgOU2

当日常需要注册一些不太重要的网站,或者不想订阅接收垃圾邮件时。

可以使用 GitHub 上这款基于 Cloudflare 构建的临时邮箱服务:MoeMail。

提供实时接收邮件、灵活设置有效期、自动清理、邮件通知、适配 PC 和手机使用等功能。

GitHub: github.com/beilunyang/moemail

并且可通过 Cloudflare 免费部署使用,项目提供了详细的部署指南。

:icon_weibo: weibo.com/5722964389/Plnwxrygh

分享 GitHub 上一份精心整理的 LangGraph 资源合集:Awesome LangGraph。

涵盖了基础介绍、入门模板、示例应用、实用工具等资源、以及整理一些如智能体、AI 助手、开发与工具、内容与媒体、知识与检索等优秀项目。

GitHub: github.com/von-development/awe

除此之外,还提供了相关的学习教程,和已经在生产环境中使用 LangGraph 的公司案例。

这份合集非常适合想深入了解 LangGraph 及其实际应用价值的开发者学习。

:icon_weibo: weibo.com/5722964389/PllX7vDfJ

分享 GitHub 上一款功能强大的实时协作笔记工具:HedgeDoc。

界面简洁,支持 Markdown 语法,可多人同时编辑同一文档,实时同步内容,非常适合小团队协作和知识管理。

GitHub: github.com/hedgedoc/hedgedoc

主要功能:

- 多种编辑模式(查看、编辑、双栏)和夜间模式,提升编辑体验

- 灵活的笔记权限管理,包括公开、可编辑、私有等六种权限级别

- 强大的图片上传功能,支持拖拽、粘贴和点击上传至 Imgur、S3、Minio 或本地

- 代码块支持超过 100 种编程语言的语法高亮和行号显示

- 丰富的图表支持,包括 UML 序列图、流程图、Mermaid 甘特图等

- 可嵌入外部内容,如 YouTube、Vimeo、Gist、SlideShare 和 PDF

可通过 Docker 一键部署方式使用,并提供了详细的安装指南。

:icon_weibo: weibo.com/5722964389/PlhDed1ts

Show older
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。