分享 GitHub 上一款强大的搜索引擎工具:Luxirty Search,基于 Google 搜索结构但专注于屏蔽内容农场,提供无广告、无跟踪的干净搜索体验。
这款工具通过内置配置让 Google 直接过滤掉垃圾网站,还能一键提升开发相关网站的搜索权重,帮助开发者更快找到高质量内容。
GitHub: https://github.com/KoriIku/luxirty-search
主要特性:
- 内置内容农场屏蔽(CSDN、各类云平台文档等)
- 一键提高 GitHub、StackOverflow 等技术网站权重
- 无广告、无跟踪链接,搜索结果干净整洁
- 支持一键搜索 v2ex、Reddit 等社区
- 支持暗黑模式和移动端适配
- 可通过 Vercel、Netlify 等平台一键部署
DeepSeek 开源周第四天:直接放出三个项目。
第三个DeepSeek Infra Profiling Data:公开了 DeepSeek 模型训练和推理过程中的真实性能剖析数据,为 AI 系统优化提供了独特价值。
通过 PyTorch Profiler 捕获的详细执行轨迹,研究人员能够直观观察大规模模型在不同阶段的计算与通信模式。
GitHub: https://github.com/deepseek-ai/profile-data
在训练阶段,数据展示了 DualPipe 如何在 EP64 配置下实现计算块的高效重叠;
在预填充阶段,记录了系统如何在 EP32 配置下平衡注意力计算负载;
在解码阶段,则呈现了 EP128 环境中通信与计算任务的协同策略。
这些数据反映了 DeepSeek-V3 的实际生产环境配置,为社区改进大型 AI 模型的分布式训练与推理提供了宝贵参考。
并且数据可在 Chrome 或 Edge 浏览器中直接可视化,便于研究分析分布式 AI 系统性能瓶颈和优化空间。
DeepSeek 开源周第四天:直接放出三个项目。
第二个 EPLB:一款专注于解决 MoE (混合专家)模型训练负载均衡问题的工具。
在使用专家并行(EP)时,不同专家被分配到不同 GPU 上,但各专家负载可能因工作负荷而显著不同,导致 GPU 资源利用不均衡。
EPLB 基于 DeepSeek-V3 论文提出的冗余专家策略,通过复制高负载专家并启发式地将其打包到不同 GPU,实现负载平衡。
GitHub: https://github.com/deepseek-ai/EPLB
同时,结合 DeepSeek-V3 的组限制专家路由技术,尽可能将同组专家放置在同一节点,减少节点间数据传输。
并提供了层次化和全局两种负载均衡策略,分别适用于不同场景,确保在大规模 MoE 模型训练中获得最佳性能。
DeepSeek 开源周第四天:直接放出三个项目。
第一个 DualPipe:一种创新的双向流水线并行算法,解决了大规模 AI 模型训练中的核心效率问题。
通过创新的调度策略,它能够完全重叠前向和后向计算-通信阶段,同时减少流水线气泡。
GitHub: https://github.com/deepseek-ai/DualPipe
与传统的 1F1B 和 ZB1P 等方法相比,DualPipe 在相同设备配置下可实现更高的训练吞吐量。
对加速大型语言模型和其他深度学习模型的分布式训练具有重要价值,特别适用于需要跨多设备训练超大规模模型的场景。
分享 GitHub 上一个从零实现 DeepSeek R1 训练过程的开源项目:train-deepseek-r1,通过手绘流程图和代码解析,让复杂的 AI 训练变得易懂。
详细展示了 DeepSeek R1 的训练流程,从基础模型开始,通过强化学习、监督微调等阶段,最终构建出具有卓越推理能力的语言模型。
GitHub: https://github.com/FareedKhan-dev/train-deepseek-r1
项目包含了:
- 使用手绘流程图详解 DeepSeek R1 架构
- 完整实现 GRPO 算法训练 R1 Zero 初始版本
- 通过 SFT 解决 R1 Zero 的混乱推理和语言混合问题
- 基于推理导向的强化学习优化模型能力
- 使用小型基础模型,让本地训练和实验成为可能
- 包含奖励函数、拒绝采样等关键技术实现细节
分享 GitHub 上一款专为 AI 应用设计的高质量 UI 组件库:prompt-kit。
该组件库可用于快速构建聊天体验、AI 智能体和自主助手等应用,提供美观且可自定义的界面组件。
GitHub: https://github.com/ibelick/prompt-kit
目前含有的组件如下:
- 提供可自定义的 AI 提示输入组件
- 支持聊天消息展示组件
- 内置 Markdown 渲染功能
- 代码块语法高亮显示
分享 GitHub 上一个专注于开放词汇感知领域的综合资源集合:Awesome-Open-Vocabulary-Perception。
这个精选列表涵盖了开放词汇感知(包括2D和3D)相关的论文和代码资源,为研究人员提供了该领域最新研究成果的集中索引。
GitHub: https://github.com/yangcaoai/Awesome-Open-Vocabulary-Perception
主要特性:
- 收录开放词汇 3D 目标检测最新研究成果
- 汇总开放词汇3D 场景分割领域重要论文
- 包含开放词汇 2D 目标检测关键工作
- 提供 2D 开放词汇分割研究资源
- 附带论文链接和官方代码实现
- 分类清晰,便于检索特定研究方向
分享 GitHub 上一款强大的开源文档 OCR 工具:olmOCR,专为高精度转换 PDF 和其他文档为纯文本而设计。
该工具能完美保留文档原始阅读顺序,支持表格、公式、手写内容识别,特别适合处理学术论文和技术文档。
GitHub: https://github.com/allenai/olmocr
主要特性:
- 高吞吐量文档处理能力
- 保留自然阅读顺序的文本转换
- 支持表格、公式和手写内容识别
- 针对学术论文和技术文档优化
- 独特提示技术提高准确率并减少幻觉
- 可部署于自有 GPU 实现高效文档处理
Awesome-Ollama-Server:一个用于监控和检测 Ollama 服务可用性和性能的系统。
提供了现代化的 Web 可视化界面,支持多语言(中文/英文),并具有实时检测和数据展示功能。
GitHub: https://github.com/forrany/Awesome-Ollama-Server
支持批量检测 Ollama 服务、实时显示检测状态和结果、自动 FOFA 扫描等服务检测。
同时提供服务响应时间和 TPS、可用模型列表等性能数据监控并可视化展示。
Anthropic 开源了一款在终端中运行的 AI 编程助手:Claude Code。
支持理解和操作本地代码库,能够执行基本编码任务、解释复杂的代码逻辑、处理 Git 工作流程等。
GitHub: https://github.com/anthropics/claude-code
除此之外,还能够回答有关代码架构和逻辑的问题,执行和修复测试、代码格式化等命令。
目前处于预览版阶段,感兴趣的同学可以安装尝试下。 #AI创造营
R1-Onevision:一个开源的多模态大语言模型,能够进行深度推理,特别擅长视觉推理任务。
并在多个领域中表现出色,如数学、科学、图像理解和逻辑推理。
GitHub: https://github.com/Fancy-MLLM/R1-Onevision
模型下载:huggingface.co/Fancy-MLLM/R1-Onevision-7B
此外,在多项推理基准测试上,超越了 Qwen2.5-VL-7B 和 GPT-4V 模型。
刚刚 DeepSeek 宣布调整 API 使用的收费。
在非高峰期,即北京时间 00:30 至 08:30 时间段,DeepSeek-V3 降至原价的 50%,DeepSeek-R1 更是低至 25%。
另外,DeepSeek 官网 API 的充值,在早几天已恢复,有需要的可以冲~
链接: 网页链接
GitHub 上一个自动化学术调研和论文生成的开源工具:SurveyX。
利用大语言模型,我们只需提供论文标题或关键词,即可生成符合主题的高质量学术论文和调研。
GitHub: https://github.com/IAAR-Shanghai/SurveyX
在项目仓库上,还提供了 30+ 个已生成的论文示例,涵盖了计算机视觉、医学影像、网络安全等多个领域。
又在 GitHub 上发现一个简洁易用的 DeepSeek 第三方开源客户端:DeepChat。
支持 DeepSeek、硅基流动、Ollama 等多个模型云服务商,支持多路聊天并发,可自由切换到新的会话使用。
GitHub: https://github.com/ThinkInAIXYZ/deepchat
除此之外,还支持完整的 Markdown 渲染,代码高亮显示等功能。
提供 Windows、macOS 和 Linux 安装包,可直接开箱即用。
GitHub 上一套适用于 MCP(模型上下文)协议的苹果原生工具:Apple MCP tools。
只需简单的几行代码,添加到 Claude 桌面配置中,即可授予访问苹果原生工具的权限。
GitHub: https://github.com/Dhravya/apple-mcp
目前已支持联系人、消息和笔记等工具,未来还会支持日历、提醒实现等功能。
分享 GitHub 上一份教程《深入挖掘 Llama 3 的从零实现》。
将帮助大家更轻松地理解和掌握 Llama 3 模型的实现原理以及详细的推理流程。
GitHub: https://github.com/therealoliver/Deepdive-llama3-from-scratch
具有如下优点:
- 清晰的目录结构,便于大家循序渐进地理解代码;
- 大量详细的代码注释,理解每一段代码的作用,初学者也能轻松上手;
- 完整注解了每一步计算中矩阵维度的变化,更容易的理解整个流程;
- 丰富的原理类说明,大量的细节推导,掌握模型的设计思想。
- 有 KV-Cache 详细的推导、核心思想等内容,深入了解 KV-Cache 每个细节。
- 提供了中英双语的代码文件,原生的中文翻译避免机翻的词不达意。
分享 GitHub 上一份精选优质的英语学习资料合集:Learning English,专注于听说读写等核心技能的提升。
包含语法、词汇、听力、口语、视频、网站、工具、课程等学习资源,助我们更好地学习英语。
GitHub: https://github.com/knowledgefxg/learning-english
适合如下同学:
- 各级英语学习者
- 寻求系统练习的自学者
- 寻找教学资源的教育工作者
- 因工作、学习或旅行需要提高英语水平的专业人士
目前项目在持续更新,有合适的好资源会持续收录!
DeepSeek 开源周第三天:DeepGEMM 项目。
专为 FP8(8位浮点数)通用矩阵乘法(GEMM)设计的高性能轻量级库,核心内核函数仅约 300 行代码。
其性能在各种矩阵形状下可媲美或超越专家调优的库,在某些情况下性能提升高达 2.7 倍。
GitHub: https://github.com/deepseek-ai/DeepGEMM
同时支持精细缩放功能,支持常规矩阵乘法和混合专家模型(MoE)的分组矩阵乘法。
目前,该项目已经在 DeepSeek-V3 模型上应用。
GitHub 上一个开源的 TypeScript 库:LLM Scraper,使用 LLMs 从任何网页中提取结构化数据。
支持 Ollama、OpenAI、Vercle AI SDK 等 LLM 提供商,允许输入 html、markdown、text、image 等多种格式化模式提取数据。
GitHub: https://github.com/mishushakov/llm-scraper
除此之外,还支持流式传输对象,并且新增了代码生成功能,以便更高效地处理数据。
GitHub 上一款开源的第三方 DeepSeek iOS 客户端:DeepSeek AI 助手。
集成 DeepSeek 强大模型能力,支持实时对话、多轮交互、历史记录管理、自定义提示词等功能。
GitHub: https://github.com/DargonLee/DeepSeek
除此之外,还支持多主题、消息本地存储、实时输入、消息复制等功能。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报