分享一个专注于 SVG 图像生成的多模态视觉语言模型:StarVector。
支持文本生成 SVG 或图像生成 SVG, 能生成精确的 SVG 代码,在图标、Logo、图表方面表现出色。
GitHub: https://github.com/joanrod/star-vector
模型已发布在 HuggingFace,提供 1B 和 8B 参数两种版本。
GitHub 上一款能将 PDF 转换为其他格式的开源工具:PDF craft。
专注于扫描书籍处理,能提取正文、过滤页眉页脚、处理跨页连接,可将 PDF 转为 Markdown 或带结构的 EPUB 电子书。
GitHub: https://github.com/oomol-lab/pdf-craft
主要功能:
- 使用本地 AI 模型将 PDF 转换为 Markdown 格式,无需联网
- 支持将 PDF 转换为带结构的 EPUB 电子书格式
- 智能识别并过滤页眉、页脚、脚注、页码等干扰元素
- 自动处理图表、公式,以图片形式保留在转换后的文件中
- 结合 LLM 技术构建书籍结构,生成带目录和章节的 EPUB
首次使用会自动下载所需 AI 模型,同时推荐配置使用 DeepSeek V3 模型。
推荐 GitHub 上一款强大的跨平台番剧采集和在线观看开源应用:Kazumi。
支持自定义规则导入和分享、流媒体在线观看、视频弹幕以及实时超分辨率等功能。
GitHub: https://github.com/Predidit/Kazumi
除此之外,还支持多视频源和无线投屏,并提供番剧目录、搜索、时间表等基础功能。
最赞的是,兼容 Android、Windows、macOS、Linux 全平台安装使用,有需求的不妨试下。
又发现一个可以免费学习英语的实用网站:engoo。
提供了对话、经济、旅行、语法、词汇、少儿英文、发音、口语等等课程内容,可根据自己喜好来学习。
链接: 网页链接
同时还分初、中、高、精通等级,并提供音频、图片和习题来配合学习。
除此之外,它还有日语和韩语的课程教材,感兴趣的也可以学习看下。
GitHub 上一款多功能网盘资源搜索与转存的开源工具:CloudSaver。
基于 Vue 3 + Express 开发,支持多源资源搜索、115 网盘与夸克网盘转存、豆瓣榜单展示,响应式界面适配移动端与 PC 端。
GitHub: https://github.com/jiangrui1994/CloudSaver
同时提供 Docker 一键部署,支持单容器和 Docker Compose 两种部署模式。
分享 GitHub 上一个开源的图像管理和分发系统:ImageFlow。
它能根据设备类型自动提供横向和纵向图像,支持 WebP、AVIF 等多种图像格式。
GitHub: https://github.com/Yuri-NagaSaki/ImageFlow
并提供 API 密钥安全验证,支持拖拽上传、实时预览、以及高效筛选和删除图片等功能。
可以通过 Docker 快速部署,并支持本地和兼容 S3 存储。
一款全面检测网络质量的多平台工具脚本:NetQuality。
支持多系统的网络质量检测,提供从 BGP 信息、本地策略到国内外网速测试的全方位网络状态分析,并支持 IPv4/IPv6 双栈查询。
GitHub: https://github.com/xykt/NetQuality
主要功能:
- 支持 Ubuntu、Debian、CentOS、macOS 等多种系统;
- 中英文双语界面,精美排版便于截图分享
- 三网 TCP 大包延迟、三网回程路由测试
- 基于 SPEEDTEST 的中国大陆三网及全球五大洲网速测试
- 延迟模式、低数据模式、自定义测试章节
- BGP 信息与上游接入信息直观展示
- 支持 Json 输出便于数据分析
使用简便,只需一行命令,同时支持多种参数组合满足不同测试需求。
跟大家分享一款隐私优先的 AI 助手和智能体构建开源工具:Clara。
它能让我们在本地设备上使用开源模型进行 AI 聊天、创建智能体并将其转换为功能完整的应用,所有数据都不会离开你的机器,真正实现隐私保护。
GitHub: https://github.com/badboysm890/ClaraVerse
主要功能:
- AI 助手:与任何 Ollama 兼容模型聊天,包括能理解图像的多模态模型
- 图像生成:使用 Stable Diffusion 模型和 ComfyUI 集成创建精美图像
- 智能体构建器:通过基于节点的编辑器设计自定义 AI 智能体
- 图像画廊:在一个方便的画廊中浏览、搜索和管理所有生成的图像
推荐使用 Docker 部署,也提供了 Windows、macOS 和 Linux 安装包使用。
分享 GitHub 上一款实用的文件转 Markdown 开源工具:serverless-markdown-convertor。
基于 Cloudflare 构建,完全免费且无需服务器,支持多种文件格式,轻松一键转换为 Markdown 格式。
GitHub: https://github.com/xxnuo/serverless-markdown-convertor
主要特性:
- 支持 PDF、图片、HTML、XML、Office 文档等多种文件格式;
- 基于 Cloudflare Worker,无需服务器即可部署;
- 可设置密码保护,防止他人滥用;
- 自定义域名支持,部署后即可拥有专属转换工具。
在 README 文件中,提供了详细的部署方法,有需要的也可以跟着教程免费部署到 Cloudflare 分享使用。
相信大家本地部署大模型都使用过 Ollama 工具,推荐一门开源免费的《动手学 Ollama》教程。
这是一门从零开始学习 Ollama 的实用教程,并通过实际应用案例深入理解,掌握大模型部署以及应用技术。
GitHub: https:// 网页链接
主要教程内容有:
- 全面的安装指南,包括 macOS、Windows、Linux 和 Docker 环境下的配置;
- 自定义导入模型教程,包括从 GGUF、Pytorch 或 Safetensors 导入;
- 多语言 API 接入指南,支持 Python、Java、JavaScript、C++ 等;
- LangChain 集成教程,实现更复杂的模型应用开发;
- 丰富的应用案例,如本地 RAG 应用、AI 编程助手、Agent 应用等。
无论是刚刚接触大模型部署的小白,还是有一定经验的开发者,都适合学习。
GitHub 上一份较全面讲解检索增强生成(RAG)技术的实用教程:All RAG Techniques。
使用简洁易懂的方式实现了 20+ 种 RAG 技术,不依赖 LangChain、FAISS 等框架,只用基础 Python 库构建,旨在让我们更容易理解 RAG 的工作原理。
GitHub: https:// 网页链接
涵盖从基础 RAG 到语义分块、查询转换、重排序、图形 RAG、层次 RAG 等高级技术。
同时每个 Jupyter 笔记都包含具体 RAG 技术的简要解释、实现步骤以及代码示例。
适合想深入了解 RAG 技术的开发者或研究人员学习。
一份精选的开源自托管 Docker 项目资源列表:Awesome Self-Host Docker。
涵盖生产力工具、开发环境、媒体服务器、通信平台、安全监控、文件共享等多个领域。
GitHub: https://github.com/hotheadhacker/awesome-selfhost-docker
所有项目均可用 Docker 和 docker-compose 快速部署。
给开发者推荐 GitHub 上一个高颜值的管理后台 UI 模板:Shadcn Admin。
使用 Shadcn 和 Vite 构建,内置丰富的实用组件和页面模板,可直接用于个人或企业项目的后台界面开发。
GitHub: https://github.com/satnaing/shadcn-admin
此外,还支持深浅主题切换,响应式界面适配各种设备,以及支持全局搜素快速定位到内容。
如果经常在终端上操作 Git 可以安装这款实用的命令行工具:git-who。
与 git blame 只能告诉你某行代码的作者不同,它能够解答 “谁写的这段代码?”,可以展示整个组件或子系统的责任人,而非针对单个文件。
GitHub: https://github.com/sinclairtarget/git-who
执行命令可查看项目主要贡献者、最后编辑时间、修改行数、提交次数等等信息,并且还可进行排序。
GitHub 上一份可能是目前收集整理最全的 MCP 服务器合集:Model Context Protocol servers,已斩获 21.4k+ Star。
包含 20+ 个官方参考实现,75+ 官方集成,150+ 实用的 MCP 服务器,涉及文件操作、数据库、API、Docker 等等内容。
GitHub: https://github.com/modelcontextprotocol/servers
同时提供详细入门指南,简单几步,即可使用该仓库的所有服务器,快速连接到 Claude 客户端。
上周跟大家推荐过夸克的 “AI 超级框”,经过这段时间体验后,完全满足了我日常搜索需求。
比如:“今天 OpenAI 刚上线了推理模型 o1-pro 的 API”,我想快速了解相关的信息。
在夸克 AI 搜索框开启 “深度思考”,并输入:“整理今天 OpenAI 刚上线的推理模型 o1-pro API 相关信息”,回车发送。
瞬间它就从多个渠道中搜索到最新发布信息,并为我整理好关键信息输出:
- 每百万 Token,输入价格为 150 美元,输出价格为 600 美元。
- 价格比 DeepSeek R1 贵了 270-1000 倍!
- 还有其核心功能与升级、市场反馈、竞品对比等等内容。
此外,我们还可以点击右上角 “AI 总结” 按钮,进一步对内容总结摘要,同时还能细问有关此问题具体信息。
不仅如此,在这里面我们还能让夸克 AI 输出清晰的脑图,如果作为一名自媒体人还可以让它输出写作观点助力创作文章,还有提炼大纲和生成 PPT 功能。
总的来说,夸克 AI 的搜索已不再是传统的简单搜索,正像它说的 “AI 超级框”,集成了众多 AI 功能,满足了我们日常生活、工作、学习中方方面面的需求。
下载体验: 网页链接
在 GitHub 上发现一款开源的文档/图像多种格式互相转换工具:Reubah。
主要功能:
- 支持多种图像格式互相转换,包括 JPG、PNG、WebP、GIF、BMP、HEIC 等;
- 多种文档格式互转,支持 PDF、DOCX、DOC、ODT、RTF、TXT 等;
- 附加了图像优化和批量处理功能;
- 提供简单易用的界面,支持深浅主题。
GitHub: https://github.com/dendianugerah/reubah
可通过 Docker 一键部署,在本地上使用,数据隐私更加安全。
一份精心整理的大语言模型学习资源合集:awesome-LLM-resourses。
涵盖了数据处理、模型训练、模型部署、o1 模型、MCP、知识库 RAG、智能体 Agents、书籍、教程、论文等资源。
GitHub: https://github.com/WangRongsheng/awesome-LLM-resourses
项目一直在持续更新,旨在成为最全面最新的大语言模型资源汇总,值得关注下。
跟大家推荐 GitHub 上一款强大的文档处理开源框架:Docling。
支持多种文档格式解析,并能与主流的生成式 AI 框架无缝集成,且能本地执行以保护敏感数据。
GitHub: https://github.com/docling-project/docling
主要功能:
- 支持的文档格式,包括 PDF、DOCX、XLSX、HTML、图片等;
- 高级 PDF 理解,包括页面布局、阅读顺序、表格结构、代码和公式等;
- 多种导出格式和选项,包括 Markdown、HTML 和无损 JSON;
- 能与 LangChain、LlamaIndex 和 Crew AI 等框架的即插即用集成;
- 支持 OCR 处理扫描的 PDF 和图像;
- 支持视觉语言模型(如 SmolDocling 等)。
在 GitHub 上发现一份精心整理的 DevOps 资源合集:Awesome DevOps。
涵盖了从云平台、容器编排、自动化工具到监控系统的所有关键 DevOps 领域,为不同阶段的 DevOps 实践提供了丰富参考。
GitHub: https://github.com/wmariuss/awesome-devops
另外还包含精选的 DevOps 书籍、会议和博客资源,以及完整的 DevOps 工程师学习路线图。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报