分享 GitHub 上一款专为 AI 应用设计的高质量 UI 组件库:prompt-kit。
该组件库可用于快速构建聊天体验、AI 智能体和自主助手等应用,提供美观且可自定义的界面组件。
GitHub: https://github.com/ibelick/prompt-kit
目前含有的组件如下:
- 提供可自定义的 AI 提示输入组件
- 支持聊天消息展示组件
- 内置 Markdown 渲染功能
- 代码块语法高亮显示
分享 GitHub 上一个专注于开放词汇感知领域的综合资源集合:Awesome-Open-Vocabulary-Perception。
这个精选列表涵盖了开放词汇感知(包括2D和3D)相关的论文和代码资源,为研究人员提供了该领域最新研究成果的集中索引。
GitHub: https://github.com/yangcaoai/Awesome-Open-Vocabulary-Perception
主要特性:
- 收录开放词汇 3D 目标检测最新研究成果
- 汇总开放词汇3D 场景分割领域重要论文
- 包含开放词汇 2D 目标检测关键工作
- 提供 2D 开放词汇分割研究资源
- 附带论文链接和官方代码实现
- 分类清晰,便于检索特定研究方向
分享 GitHub 上一款强大的开源文档 OCR 工具:olmOCR,专为高精度转换 PDF 和其他文档为纯文本而设计。
该工具能完美保留文档原始阅读顺序,支持表格、公式、手写内容识别,特别适合处理学术论文和技术文档。
GitHub: https://github.com/allenai/olmocr
主要特性:
- 高吞吐量文档处理能力
- 保留自然阅读顺序的文本转换
- 支持表格、公式和手写内容识别
- 针对学术论文和技术文档优化
- 独特提示技术提高准确率并减少幻觉
- 可部署于自有 GPU 实现高效文档处理
Awesome-Ollama-Server:一个用于监控和检测 Ollama 服务可用性和性能的系统。
提供了现代化的 Web 可视化界面,支持多语言(中文/英文),并具有实时检测和数据展示功能。
GitHub: https://github.com/forrany/Awesome-Ollama-Server
支持批量检测 Ollama 服务、实时显示检测状态和结果、自动 FOFA 扫描等服务检测。
同时提供服务响应时间和 TPS、可用模型列表等性能数据监控并可视化展示。
Anthropic 开源了一款在终端中运行的 AI 编程助手:Claude Code。
支持理解和操作本地代码库,能够执行基本编码任务、解释复杂的代码逻辑、处理 Git 工作流程等。
GitHub: https://github.com/anthropics/claude-code
除此之外,还能够回答有关代码架构和逻辑的问题,执行和修复测试、代码格式化等命令。
目前处于预览版阶段,感兴趣的同学可以安装尝试下。 #AI创造营
R1-Onevision:一个开源的多模态大语言模型,能够进行深度推理,特别擅长视觉推理任务。
并在多个领域中表现出色,如数学、科学、图像理解和逻辑推理。
GitHub: https://github.com/Fancy-MLLM/R1-Onevision
模型下载:huggingface.co/Fancy-MLLM/R1-Onevision-7B
此外,在多项推理基准测试上,超越了 Qwen2.5-VL-7B 和 GPT-4V 模型。
刚刚 DeepSeek 宣布调整 API 使用的收费。
在非高峰期,即北京时间 00:30 至 08:30 时间段,DeepSeek-V3 降至原价的 50%,DeepSeek-R1 更是低至 25%。
另外,DeepSeek 官网 API 的充值,在早几天已恢复,有需要的可以冲~
链接: 网页链接
GitHub 上一个自动化学术调研和论文生成的开源工具:SurveyX。
利用大语言模型,我们只需提供论文标题或关键词,即可生成符合主题的高质量学术论文和调研。
GitHub: https://github.com/IAAR-Shanghai/SurveyX
在项目仓库上,还提供了 30+ 个已生成的论文示例,涵盖了计算机视觉、医学影像、网络安全等多个领域。
又在 GitHub 上发现一个简洁易用的 DeepSeek 第三方开源客户端:DeepChat。
支持 DeepSeek、硅基流动、Ollama 等多个模型云服务商,支持多路聊天并发,可自由切换到新的会话使用。
GitHub: https://github.com/ThinkInAIXYZ/deepchat
除此之外,还支持完整的 Markdown 渲染,代码高亮显示等功能。
提供 Windows、macOS 和 Linux 安装包,可直接开箱即用。
GitHub 上一套适用于 MCP(模型上下文)协议的苹果原生工具:Apple MCP tools。
只需简单的几行代码,添加到 Claude 桌面配置中,即可授予访问苹果原生工具的权限。
GitHub: https://github.com/Dhravya/apple-mcp
目前已支持联系人、消息和笔记等工具,未来还会支持日历、提醒实现等功能。
分享 GitHub 上一份教程《深入挖掘 Llama 3 的从零实现》。
将帮助大家更轻松地理解和掌握 Llama 3 模型的实现原理以及详细的推理流程。
GitHub: https://github.com/therealoliver/Deepdive-llama3-from-scratch
具有如下优点:
- 清晰的目录结构,便于大家循序渐进地理解代码;
- 大量详细的代码注释,理解每一段代码的作用,初学者也能轻松上手;
- 完整注解了每一步计算中矩阵维度的变化,更容易的理解整个流程;
- 丰富的原理类说明,大量的细节推导,掌握模型的设计思想。
- 有 KV-Cache 详细的推导、核心思想等内容,深入了解 KV-Cache 每个细节。
- 提供了中英双语的代码文件,原生的中文翻译避免机翻的词不达意。
分享 GitHub 上一份精选优质的英语学习资料合集:Learning English,专注于听说读写等核心技能的提升。
包含语法、词汇、听力、口语、视频、网站、工具、课程等学习资源,助我们更好地学习英语。
GitHub: https://github.com/knowledgefxg/learning-english
适合如下同学:
- 各级英语学习者
- 寻求系统练习的自学者
- 寻找教学资源的教育工作者
- 因工作、学习或旅行需要提高英语水平的专业人士
目前项目在持续更新,有合适的好资源会持续收录!
DeepSeek 开源周第三天:DeepGEMM 项目。
专为 FP8(8位浮点数)通用矩阵乘法(GEMM)设计的高性能轻量级库,核心内核函数仅约 300 行代码。
其性能在各种矩阵形状下可媲美或超越专家调优的库,在某些情况下性能提升高达 2.7 倍。
GitHub: https://github.com/deepseek-ai/DeepGEMM
同时支持精细缩放功能,支持常规矩阵乘法和混合专家模型(MoE)的分组矩阵乘法。
目前,该项目已经在 DeepSeek-V3 模型上应用。
GitHub 上一个开源的 TypeScript 库:LLM Scraper,使用 LLMs 从任何网页中提取结构化数据。
支持 Ollama、OpenAI、Vercle AI SDK 等 LLM 提供商,允许输入 html、markdown、text、image 等多种格式化模式提取数据。
GitHub: https://github.com/mishushakov/llm-scraper
除此之外,还支持流式传输对象,并且新增了代码生成功能,以便更高效地处理数据。
GitHub 上一款开源的第三方 DeepSeek iOS 客户端:DeepSeek AI 助手。
集成 DeepSeek 强大模型能力,支持实时对话、多轮交互、历史记录管理、自定义提示词等功能。
GitHub: https://github.com/DargonLee/DeepSeek
除此之外,还支持多主题、消息本地存储、实时输入、消息复制等功能。
GitHub 上一个易上手的多平台 LLM 聊天机器人及开发框架:AstrBot。
一个松耦合、异步、支持多消息平台部署、具有易用的插件系统和完善的大语言模型(LLM)接入功能的聊天机器人及开发框架。
GitHub: https://github.com/Soulter/AstrBot
- 支持各种大语言模型,包括 OpenAI、Gemini、DeepSeek 等。
- 支持接入 QQ、QQ 频道、飞书、Telegram 等消息平台。
- 支持部分 Agent 能力,如代码执行器、自然语言待办、网页搜索。
- 支持对接 Dify 平台,便捷接入 Dify 智能助手、知识库和 Dify 工作流。
- 支持可视化修改配置、插件管理、日志查看等功能,降低配置难度。
提供 Windows 一键安装器部署,以及 Docker、Replit、CasaOS 等多种部署方式。
GitHub 上一款专注于免费流媒体资源的桌面音乐播放器:nuclear。
从互联网的各个角落拉取免费的音乐资源,并提供了一个美观、强大的播放界面。
GitHub: https://github.com/nukeop/nuclear
- 搜索和播放YouTube上的音乐功能
- 专辑搜索功能,查看专辑, 基于艺术家和曲目名称的自动歌曲查询
- 歌曲队列,可以作为播放列表导出。
- 加载保存的播放列表 (储存在json格式文件中)。
- 带评论的最新出版歌曲 - 专辑和音轨。
- 按照音乐流派浏览。
- 音乐电台模式 (自动排查类似的曲目)。
- 无限制的下载 (基于youtube提供的服务)。
- 实时歌词展示。
- 将喜欢的歌曲添加到你的喜爱曲目列表中。
- 在本地库文件中听歌。
提供 Windows、macOS 和 Linux 安装包,可直接开箱即用。
GitHub 上一个简单易用的一站式 AI 数字人系统:AigcPanel。
支持视频合成、声音合成、声音克隆,简化本地模型管理、一键导入和使用 AI 模型。
GitHub: https://github.com/modstart-lib/aigcpanel
- 支持视频数字人合成,支持视频画面和声音换口型匹配
- 支持语音合成、语音克隆,多种声音参数可设置
- 支持多模型导入、一键启动、模型设置、模型日志查看
- 支持国际化,支持简体中文、英语等
- 支持多种模型一键启动包,如 CosyVoice、MuseTalk、LatentSync、Wav2Lip 等
GitHub 上一款开源免费、可离线运行的高级 RAG 对话工具:DeepSeek RAG Chatbot。
集成了 DeepSeek、GraphRAG 等技术,能够从 PDF、DOCX 和 TXT 文件中快速准确地检索信息。
GitHub: https://github.com/SaiAkhil066/DeepSeek-RAG-Chatbot
同时含有聊天历史记忆功能,以及改进的错误处理机制,让回答更加连贯更加流畅。
支持 Docker 一键部署方式,整个工具均可离线使用,保证了数据的安全隐私。
DeepSeek 开源周第二天:DeepEP 项目。
第一个开源的混合专家模型 (MoE) 模型训练和推理专家并行 (EP) 通信库。
GitHub: https://github.com/deepseek-ai/DeepEP
✅ 高效优化的 all-to-all 通信
✅ 同时支持节点内(NVLink)和节点间(RDMA)通信
✅ 高吞吐量内核用于训练和推理预填充
✅ 低延迟内核用于推理解码
✅ 原生支持 FP8 dispatch 操作
✅ 灵活的 GPU 资源控制实现通信-计算重叠
并基于 DeepSeek-V3 中提出的算法优化,为大规模 AI 模型提供卓越的通信性能。
在 H800 GPU 上,节点内通信可达 150+ GB/s,节点间通信可达 40+ GB/s,解码延迟低至 186 μs。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报