推荐 GitHub 上一个好用的提示词优化工具:Prompt Optimizer。
可以帮助我们优化和测试 AI 提示词,支持 Web 应用和 Chrome 插件两种使用方式,提升 AI 回复的准确度。
GitHub: https://github.com/linshenkx/prompt-optimizer
主要特性:
- 一键优化提示词,支持多轮迭代改进
- 实时测试优化后的提示词效果,对比前后差异
- 支持 OpenAI、Gemini、DeepSeek 等主流 AI 模型
- 纯客户端处理,数据直接与 AI 服务商交互
- 本地加密存储历史记录和 API 密钥
- 提供 Web 应用和 Chrome 插件两种使用方式
分享 GitHub 上一款专注于 B 站直播切片和投稿的工具:BiliBili ShadowReplay。
该工具能够缓存 B 站直播并进行实时编辑投稿,通过划定时间区间,将整个直播切片及投稿流程压缩到分钟级别。
GitHub: https://github.com/Xinrea/bili-shadowreplay
主要特性:
- 直播间管理功能,支持添加多个直播间进行缓存
- 实时缓存直播并支持切片编辑投稿
- 历史直播回放及编辑功能
- 多账号管理,自由选择投稿或发送弹幕账号
- 预览窗口支持弹幕观看和发送
- 直观的缓存空间管理和消息记录系统
DeepSeek 开源周第五天:放出两个项目。
第二个 smallpond:基于 DuckDB 和 3FS 构建,轻量级数据处理框架,专为处理 PB 级数据集设计。
该框架提供高性能数据处理能力,无需长期运行服务,操作简便,支持 Python 3.8 至 3.12 版本。
GitHub: https://github.com/deepseek-ai/smallpond
主要特性:
- 基于 DuckDB 的高性能数据处理
- 可扩展至 PB 级数据集处理
- 简单操作,无需长期运行服务
- 支持数据分区和 SQL 查询
- 在 GraySort 基准测试中达到 3.66 TiB/分钟吞吐量
- 提供完整文档和 API 参考
DeepSeek 开源周第五天:放出两个项目。
第一个 Fire-Flyer File System (3FS):一款高性能分布式文件系统,专为 AI 训练和推理工作负载设计。
利用现代 SSD 和 RDMA 网络提供共享存储层,支持高达 6.6 TiB/s 的聚合读取吞吐量,简化分布式应用开发。
GitHub: https://github.com/deepseek-ai/3fs
主要特点和优势:
- 分离式架构,可访问数千 SSD 和数百存储节点的网络带宽
- 强一致性实现,采用链式复制与分配查询 (CRAQ)
- 支持数据准备、数据加载器、检查点和推理 KVCache
- 提供标准文件接口,无需学习新存储 API
- 测试显示在灰度排序测试中达到 3.66 TiB/分钟吞吐量
分享 GitHub 上一款个人微信免费开源框架:Gewechat。
支持二次开发与任意语言接入,无需安装电脑微信或手机破解插件,提供消息自动化、自定义回复、群管理及各种业务模型接入能力。
GitHub: https://github.com/alex-oos/ai-wechat-bot
主要能力:
- 支持发送文本、图片、文件、小程序等多种消息类型
- 自定义消息处理与自动回复功能
- 完整的群管理与好友管理能力
- AI 模型接入支持(如 ChatGPT、Sora)
- 基于 Docker 快速部署,操作简单
- 提供完整的 API 文档与多语言支持
同样需要注意,建议使用小号来尝试。 #AI创造营
分享 GitHub 上一款基于 AI 的趋势发现和内容发布系统:TrendPublish。
该系统支持多源数据采集、AI 智能处理,可将内容自动发布到微信公众号,适合需要自动化内容创作的运营者。
GitHub: https://github.com/OpenAISpace/ai-trend-publish
主要功能:
- 多源数据采集(Twitter/X、网站内容)
- 使用 DeepseekAI 进行内容智能总结
- 微信公众号自动发布功能
- 支持自定义文章模板
- 定时发布任务管理
- Bark 通知系统集成
分享 GitHub 上一款云原生 GenAI 推理基础设施构建工具:AIBrix。
该工具提供企业级大型语言模型 (LLM) 推理部署、管理和扩展的完整解决方案,专为满足企业需求而设计。
GitHub: https://github.com/vllm-project/aibrix
主要特性:
- 高密度 LoRA 管理系统
- LLM 网关和路由功能
- 专为 LLM 应用定制的自动扩展器
- 统一 AI 运行时环境
- 分布式推理和 KV 缓存架构
- 智能混用不同 GPU 以降低运行成本
分享 GitHub 上一款强大的搜索引擎工具:Luxirty Search,基于 Google 搜索结构但专注于屏蔽内容农场,提供无广告、无跟踪的干净搜索体验。
这款工具通过内置配置让 Google 直接过滤掉垃圾网站,还能一键提升开发相关网站的搜索权重,帮助开发者更快找到高质量内容。
GitHub: https://github.com/KoriIku/luxirty-search
主要特性:
- 内置内容农场屏蔽(CSDN、各类云平台文档等)
- 一键提高 GitHub、StackOverflow 等技术网站权重
- 无广告、无跟踪链接,搜索结果干净整洁
- 支持一键搜索 v2ex、Reddit 等社区
- 支持暗黑模式和移动端适配
- 可通过 Vercel、Netlify 等平台一键部署
DeepSeek 开源周第四天:直接放出三个项目。
第三个DeepSeek Infra Profiling Data:公开了 DeepSeek 模型训练和推理过程中的真实性能剖析数据,为 AI 系统优化提供了独特价值。
通过 PyTorch Profiler 捕获的详细执行轨迹,研究人员能够直观观察大规模模型在不同阶段的计算与通信模式。
GitHub: https://github.com/deepseek-ai/profile-data
在训练阶段,数据展示了 DualPipe 如何在 EP64 配置下实现计算块的高效重叠;
在预填充阶段,记录了系统如何在 EP32 配置下平衡注意力计算负载;
在解码阶段,则呈现了 EP128 环境中通信与计算任务的协同策略。
这些数据反映了 DeepSeek-V3 的实际生产环境配置,为社区改进大型 AI 模型的分布式训练与推理提供了宝贵参考。
并且数据可在 Chrome 或 Edge 浏览器中直接可视化,便于研究分析分布式 AI 系统性能瓶颈和优化空间。
DeepSeek 开源周第四天:直接放出三个项目。
第二个 EPLB:一款专注于解决 MoE (混合专家)模型训练负载均衡问题的工具。
在使用专家并行(EP)时,不同专家被分配到不同 GPU 上,但各专家负载可能因工作负荷而显著不同,导致 GPU 资源利用不均衡。
EPLB 基于 DeepSeek-V3 论文提出的冗余专家策略,通过复制高负载专家并启发式地将其打包到不同 GPU,实现负载平衡。
GitHub: https://github.com/deepseek-ai/EPLB
同时,结合 DeepSeek-V3 的组限制专家路由技术,尽可能将同组专家放置在同一节点,减少节点间数据传输。
并提供了层次化和全局两种负载均衡策略,分别适用于不同场景,确保在大规模 MoE 模型训练中获得最佳性能。
DeepSeek 开源周第四天:直接放出三个项目。
第一个 DualPipe:一种创新的双向流水线并行算法,解决了大规模 AI 模型训练中的核心效率问题。
通过创新的调度策略,它能够完全重叠前向和后向计算-通信阶段,同时减少流水线气泡。
GitHub: https://github.com/deepseek-ai/DualPipe
与传统的 1F1B 和 ZB1P 等方法相比,DualPipe 在相同设备配置下可实现更高的训练吞吐量。
对加速大型语言模型和其他深度学习模型的分布式训练具有重要价值,特别适用于需要跨多设备训练超大规模模型的场景。
分享 GitHub 上一个从零实现 DeepSeek R1 训练过程的开源项目:train-deepseek-r1,通过手绘流程图和代码解析,让复杂的 AI 训练变得易懂。
详细展示了 DeepSeek R1 的训练流程,从基础模型开始,通过强化学习、监督微调等阶段,最终构建出具有卓越推理能力的语言模型。
GitHub: https://github.com/FareedKhan-dev/train-deepseek-r1
项目包含了:
- 使用手绘流程图详解 DeepSeek R1 架构
- 完整实现 GRPO 算法训练 R1 Zero 初始版本
- 通过 SFT 解决 R1 Zero 的混乱推理和语言混合问题
- 基于推理导向的强化学习优化模型能力
- 使用小型基础模型,让本地训练和实验成为可能
- 包含奖励函数、拒绝采样等关键技术实现细节
分享 GitHub 上一款专为 AI 应用设计的高质量 UI 组件库:prompt-kit。
该组件库可用于快速构建聊天体验、AI 智能体和自主助手等应用,提供美观且可自定义的界面组件。
GitHub: https://github.com/ibelick/prompt-kit
目前含有的组件如下:
- 提供可自定义的 AI 提示输入组件
- 支持聊天消息展示组件
- 内置 Markdown 渲染功能
- 代码块语法高亮显示
分享 GitHub 上一个专注于开放词汇感知领域的综合资源集合:Awesome-Open-Vocabulary-Perception。
这个精选列表涵盖了开放词汇感知(包括2D和3D)相关的论文和代码资源,为研究人员提供了该领域最新研究成果的集中索引。
GitHub: https://github.com/yangcaoai/Awesome-Open-Vocabulary-Perception
主要特性:
- 收录开放词汇 3D 目标检测最新研究成果
- 汇总开放词汇3D 场景分割领域重要论文
- 包含开放词汇 2D 目标检测关键工作
- 提供 2D 开放词汇分割研究资源
- 附带论文链接和官方代码实现
- 分类清晰,便于检索特定研究方向
分享 GitHub 上一款强大的开源文档 OCR 工具:olmOCR,专为高精度转换 PDF 和其他文档为纯文本而设计。
该工具能完美保留文档原始阅读顺序,支持表格、公式、手写内容识别,特别适合处理学术论文和技术文档。
GitHub: https://github.com/allenai/olmocr
主要特性:
- 高吞吐量文档处理能力
- 保留自然阅读顺序的文本转换
- 支持表格、公式和手写内容识别
- 针对学术论文和技术文档优化
- 独特提示技术提高准确率并减少幻觉
- 可部署于自有 GPU 实现高效文档处理
Awesome-Ollama-Server:一个用于监控和检测 Ollama 服务可用性和性能的系统。
提供了现代化的 Web 可视化界面,支持多语言(中文/英文),并具有实时检测和数据展示功能。
GitHub: https://github.com/forrany/Awesome-Ollama-Server
支持批量检测 Ollama 服务、实时显示检测状态和结果、自动 FOFA 扫描等服务检测。
同时提供服务响应时间和 TPS、可用模型列表等性能数据监控并可视化展示。
Anthropic 开源了一款在终端中运行的 AI 编程助手:Claude Code。
支持理解和操作本地代码库,能够执行基本编码任务、解释复杂的代码逻辑、处理 Git 工作流程等。
GitHub: https://github.com/anthropics/claude-code
除此之外,还能够回答有关代码架构和逻辑的问题,执行和修复测试、代码格式化等命令。
目前处于预览版阶段,感兴趣的同学可以安装尝试下。 #AI创造营
R1-Onevision:一个开源的多模态大语言模型,能够进行深度推理,特别擅长视觉推理任务。
并在多个领域中表现出色,如数学、科学、图像理解和逻辑推理。
GitHub: https://github.com/Fancy-MLLM/R1-Onevision
模型下载:huggingface.co/Fancy-MLLM/R1-Onevision-7B
此外,在多项推理基准测试上,超越了 Qwen2.5-VL-7B 和 GPT-4V 模型。
刚刚 DeepSeek 宣布调整 API 使用的收费。
在非高峰期,即北京时间 00:30 至 08:30 时间段,DeepSeek-V3 降至原价的 50%,DeepSeek-R1 更是低至 25%。
另外,DeepSeek 官网 API 的充值,在早几天已恢复,有需要的可以冲~
链接: 网页链接
GitHub 上一个自动化学术调研和论文生成的开源工具:SurveyX。
利用大语言模型,我们只需提供论文标题或关键词,即可生成符合主题的高质量学术论文和调研。
GitHub: https://github.com/IAAR-Shanghai/SurveyX
在项目仓库上,还提供了 30+ 个已生成的论文示例,涵盖了计算机视觉、医学影像、网络安全等多个领域。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报