Show newer

分享 GitHub 上一款专为 AI 应用设计的高质量 UI 组件库:prompt-kit。

该组件库可用于快速构建聊天体验、AI 智能体和自主助手等应用,提供美观且可自定义的界面组件。

GitHub: github.com/ibelick/prompt-kit

目前含有的组件如下:

- 提供可自定义的 AI 提示输入组件

- 支持聊天消息展示组件

- 内置 Markdown 渲染功能

- 代码块语法高亮显示

:icon_weibo: weibo.com/5722964389/PgcBiA2Zj

分享 GitHub 上一个专注于开放词汇感知领域的综合资源集合:Awesome-Open-Vocabulary-Perception。

这个精选列表涵盖了开放词汇感知(包括2D和3D)相关的论文和代码资源,为研究人员提供了该领域最新研究成果的集中索引。

GitHub: github.com/yangcaoai/Awesome-O

主要特性:

- 收录开放词汇 3D 目标检测最新研究成果

- 汇总开放词汇3D 场景分割领域重要论文

- 包含开放词汇 2D 目标检测关键工作

- 提供 2D 开放词汇分割研究资源

- 附带论文链接和官方代码实现

- 分类清晰,便于检索特定研究方向

:icon_weibo: weibo.com/5722964389/PgbCpEfyb

分享 GitHub 上一款强大的开源文档 OCR 工具:olmOCR,专为高精度转换 PDF 和其他文档为纯文本而设计。

该工具能完美保留文档原始阅读顺序,支持表格、公式、手写内容识别,特别适合处理学术论文和技术文档。

GitHub: github.com/allenai/olmocr

主要特性:

- 高吞吐量文档处理能力

- 保留自然阅读顺序的文本转换

- 支持表格、公式和手写内容识别

- 针对学术论文和技术文档优化

- 独特提示技术提高准确率并减少幻觉

- 可部署于自有 GPU 实现高效文档处理

:icon_weibo: weibo.com/5722964389/Pgbe40pIy

Awesome-Ollama-Server:一个用于监控和检测 Ollama 服务可用性和性能的系统。

提供了现代化的 Web 可视化界面,支持多语言(中文/英文),并具有实时检测和数据展示功能。

GitHub: github.com/forrany/Awesome-Oll

支持批量检测 Ollama 服务、实时显示检测状态和结果、自动 FOFA 扫描等服务检测。

同时提供服务响应时间和 TPS、可用模型列表等性能数据监控并可视化展示。

:icon_weibo: weibo.com/5722964389/Pg76lr5Uw

Anthropic 开源了一款在终端中运行的 AI 编程助手:Claude Code。

支持理解和操作本地代码库,能够执行基本编码任务、解释复杂的代码逻辑、处理 Git 工作流程等。

GitHub: github.com/anthropics/claude-c

除此之外,还能够回答有关代码架构和逻辑的问题,执行和修复测试、代码格式化等命令。

目前处于预览版阶段,感兴趣的同学可以安装尝试下。

:icon_weibo: weibo.com/5722964389/Pg6Uatfsk

R1-Onevision:一个开源的多模态大语言模型,能够进行深度推理,特别擅长视觉推理任务。

并在多个领域中表现出色,如数学、科学、图像理解和逻辑推理。

GitHub: github.com/Fancy-MLLM/R1-Onevi

模型下载:huggingface.co/Fancy-MLLM/R1-Onevision-7B

此外,在多项推理基准测试上,超越了 Qwen2.5-VL-7B 和 GPT-4V 模型。

:icon_weibo: weibo.com/5722964389/Pg6HZyIyD

刚刚 DeepSeek 宣布调整 API 使用的收费。

在非高峰期,即北京时间 00:30 至 08:30 时间段,DeepSeek-V3 降至原价的 50%,DeepSeek-R1 更是低至 25%。

另外,DeepSeek 官网 API 的充值,在早几天已恢复,有需要的可以冲~

链接: 网页链接

:icon_weibo: weibo.com/5722964389/Pg6ysvgDW

GitHub 上一个自动化学术调研和论文生成的开源工具:SurveyX。

利用大语言模型,我们只需提供论文标题或关键词,即可生成符合主题的高质量学术论文和调研。

GitHub: github.com/IAAR-Shanghai/Surve

在项目仓库上,还提供了 30+ 个已生成的论文示例,涵盖了计算机视觉、医学影像、网络安全等多个领域。

:icon_weibo: weibo.com/5722964389/Pg6kR6WIs

又在 GitHub 上发现一个简洁易用的 DeepSeek 第三方开源客户端:DeepChat。

支持 DeepSeek、硅基流动、Ollama 等多个模型云服务商,支持多路聊天并发,可自由切换到新的会话使用。

GitHub: github.com/ThinkInAIXYZ/deepch

除此之外,还支持完整的 Markdown 渲染,代码高亮显示等功能。

提供 Windows、macOS 和 Linux 安装包,可直接开箱即用。

:icon_weibo: weibo.com/5722964389/Pg68T86nE

GitHub 上一套适用于 MCP(模型上下文)协议的苹果原生工具:Apple MCP tools。

只需简单的几行代码,添加到 Claude 桌面配置中,即可授予访问苹果原生工具的权限。

GitHub: github.com/Dhravya/apple-mcp

目前已支持联系人、消息和笔记等工具,未来还会支持日历、提醒实现等功能。

:icon_weibo: weibo.com/5722964389/Pg4WozsQ2

分享 GitHub 上一份教程《深入挖掘 Llama 3 的从零实现》。

将帮助大家更轻松地理解和掌握 Llama 3 模型的实现原理以及详细的推理流程。

GitHub: github.com/therealoliver/Deepd

具有如下优点:

- 清晰的目录结构,便于大家循序渐进地理解代码;

- 大量详细的代码注释,理解每一段代码的作用,初学者也能轻松上手;

- 完整注解了每一步计算中矩阵维度的变化,更容易的理解整个流程;

- 丰富的原理类说明,大量的细节推导,掌握模型的设计思想。

- 有 KV-Cache 详细的推导、核心思想等内容,深入了解 KV-Cache 每个细节。

- 提供了中英双语的代码文件,原生的中文翻译避免机翻的词不达意。

:icon_weibo: weibo.com/5722964389/Pg3za21Li

分享 GitHub 上一份精选优质的英语学习资料合集:Learning English,专注于听说读写等核心技能的提升。

包含语法、词汇、听力、口语、视频、网站、工具、课程等学习资源,助我们更好地学习英语。

GitHub: github.com/knowledgefxg/learni

适合如下同学:

- 各级英语学习者

- 寻求系统练习的自学者

- 寻找教学资源的教育工作者

- 因工作、学习或旅行需要提高英语水平的专业人士

目前项目在持续更新,有合适的好资源会持续收录!

:icon_weibo: weibo.com/5722964389/Pg3df2PHF

DeepSeek 开源周第三天:DeepGEMM 项目。

专为 FP8(8位浮点数)通用矩阵乘法(GEMM)设计的高性能轻量级库,核心内核函数仅约 300 行代码。

其性能在各种矩阵形状下可媲美或超越专家调优的库,在某些情况下性能提升高达 2.7 倍。

GitHub: github.com/deepseek-ai/DeepGEM

同时支持精细缩放功能,支持常规矩阵乘法和混合专家模型(MoE)的分组矩阵乘法。

目前,该项目已经在 DeepSeek-V3 模型上应用。

:icon_weibo: weibo.com/5722964389/Pg2Nc8Jce

GitHub 上一个开源的 TypeScript 库:LLM Scraper,使用 LLMs 从任何网页中提取结构化数据。

支持 Ollama、OpenAI、Vercle AI SDK 等 LLM 提供商,允许输入 html、markdown、text、image 等多种格式化模式提取数据。

GitHub: github.com/mishushakov/llm-scr

除此之外,还支持流式传输对象,并且新增了代码生成功能,以便更高效地处理数据。

:icon_weibo: weibo.com/5722964389/PfXFQwK7d

GitHub 上一款开源的第三方 DeepSeek iOS 客户端:DeepSeek AI 助手。

集成 DeepSeek 强大模型能力,支持实时对话、多轮交互、历史记录管理、自定义提示词等功能。

GitHub: github.com/DargonLee/DeepSeek

除此之外,还支持多主题、消息本地存储、实时输入、消息复制等功能。

:icon_weibo: weibo.com/5722964389/PfWuMC0MK

GitHub 上一个易上手的多平台 LLM 聊天机器人及开发框架:AstrBot。

一个松耦合、异步、支持多消息平台部署、具有易用的插件系统和完善的大语言模型(LLM)接入功能的聊天机器人及开发框架。

GitHub: github.com/Soulter/AstrBot

- 支持各种大语言模型,包括 OpenAI、Gemini、DeepSeek 等。

- 支持接入 QQ、QQ 频道、飞书、Telegram 等消息平台。

- 支持部分 Agent 能力,如代码执行器、自然语言待办、网页搜索。

- 支持对接 Dify 平台,便捷接入 Dify 智能助手、知识库和 Dify 工作流。

- 支持可视化修改配置、插件管理、日志查看等功能,降低配置难度。

提供 Windows 一键安装器部署,以及 Docker、Replit、CasaOS 等多种部署方式。

:icon_weibo: weibo.com/5722964389/PfW8tjB04

GitHub 上一款专注于免费流媒体资源的桌面音乐播放器:nuclear。

从互联网的各个角落拉取免费的音乐资源,并提供了一个美观、强大的播放界面。

GitHub: github.com/nukeop/nuclear

- 搜索和播放YouTube上的音乐功能

- 专辑搜索功能,查看专辑, 基于艺术家和曲目名称的自动歌曲查询

- 歌曲队列,可以作为播放列表导出。

- 加载保存的播放列表 (储存在json格式文件中)。

- 带评论的最新出版歌曲 - 专辑和音轨。

- 按照音乐流派浏览。

- 音乐电台模式 (自动排查类似的曲目)。

- 无限制的下载 (基于youtube提供的服务)。

- 实时歌词展示。

- 将喜欢的歌曲添加到你的喜爱曲目列表中。

- 在本地库文件中听歌。

提供 Windows、macOS 和 Linux 安装包,可直接开箱即用。

:icon_weibo: weibo.com/5722964389/PfVvU7XbQ

GitHub 上一个简单易用的一站式 AI 数字人系统:AigcPanel。

支持视频合成、声音合成、声音克隆,简化本地模型管理、一键导入和使用 AI 模型。

GitHub: github.com/modstart-lib/aigcpa

- 支持视频数字人合成,支持视频画面和声音换口型匹配

- 支持语音合成、语音克隆,多种声音参数可设置

- 支持多模型导入、一键启动、模型设置、模型日志查看

- 支持国际化,支持简体中文、英语等

- 支持多种模型一键启动包,如 CosyVoice、MuseTalk、LatentSync、Wav2Lip 等

:icon_weibo: weibo.com/5722964389/PfUTAoGHJ

GitHub 上一款开源免费、可离线运行的高级 RAG 对话工具:DeepSeek RAG Chatbot。

集成了 DeepSeek、GraphRAG 等技术,能够从 PDF、DOCX 和 TXT 文件中快速准确地检索信息。

GitHub: github.com/SaiAkhil066/DeepSee

同时含有聊天历史记忆功能,以及改进的错误处理机制,让回答更加连贯更加流畅。

支持 Docker 一键部署方式,整个工具均可离线使用,保证了数据的安全隐私。

:icon_weibo: weibo.com/5722964389/PfU8FfomZ

DeepSeek 开源周第二天:DeepEP 项目。

第一个开源的混合专家模型 (MoE) 模型训练和推理专家并行 (EP) 通信库。

GitHub: github.com/deepseek-ai/DeepEP

✅ 高效优化的 all-to-all 通信

✅ 同时支持节点内(NVLink)和节点间(RDMA)通信

✅ 高吞吐量内核用于训练和推理预填充

✅ 低延迟内核用于推理解码

✅ 原生支持 FP8 dispatch 操作

✅ 灵活的 GPU 资源控制实现通信-计算重叠

并基于 DeepSeek-V3 中提出的算法优化,为大规模 AI 模型提供卓越的通信性能。

在 H800 GPU 上,节点内通信可达 150+ GB/s,节点间通信可达 40+ GB/s,解码延迟低至 186 μs。

:icon_weibo: weibo.com/5722964389/PfTIDiUWw

Show older
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。