想要了解 AIGC 前沿信息,在 arXiv 上翻阅最新发布的论文是个不错的信息渠道。

给大家推荐一个名为 “Arxiv Daily AIGC” 的开源项目,它能自动筛选出 arXiv 上与图像/视频生成相关的最新论文,提高我们的效率。

利用 AI 智能判断论文相关性,自动生成美观的 HTML 页面展示结果,并可通过 GitHub Actions 每天自动更新,全自动不需要人工干预。

GitHub: github.com/onion-liu/arxiv_dai

主要功能:

- 每日自动抓取 arXiv 上 CS.CV 领域的最新论文;

- 使用 AI 智能筛选与图像/视频/多模态生成相关的论文;

- 对论文按多个维度进行价值打分,帮助快速判断重要性;

- 生成结构化 JSON 数据便于二次开发和分析;

- 自动生成美观的 HTML 页面,支持按日期浏览;

- 通过 GitHub Actions 实现全自动化部署和更新。

通过克隆代码到本地,简单配置 API Key,即可搭建属于自己的 AIGC 论文日报。

:icon_weibo: weibo.com/5722964389/PqShEu5Ca

来自 Google DeepMind 团队的高级 AI 开发工程师 Philipp Schmid,分享的一篇《从零到一:学习代理模式》文章,值得一看。

它系统地梳理了 AI 代理设计中的常见模式,并通过分类介绍工作流模式和代理模式之间的区别。

同时详细解析了从简单的提示链接到复杂的多代理协作等 7 种核心模式,每种模式配有代码示例,不依赖任何特定框架。

文章地址: https:// 网页链接

主要内容概括:

- 3 种工作流模式:提示链接、路由、并行化处理;

- 4 种代理模式:反思模式、工具使用、规划模式、多代理模式;

- 每种模式都包含使用场景和适用条件分析;

- 提供简洁易懂的代码示例,无需依赖特定框架;

- 详细讲解何时使用(或不使用)代理架构。

适合想要设计和构建 AI 代理系统的开发者学习参考。

:icon_weibo: weibo.com/5722964389/PqQUpEPwV

在 GitHub 上挖掘到感兴趣的项目,理解其代码结构和核心逻辑往往特别头疼,尤其是在没有提供详细的 README 文件介绍时更是一头雾水。

不过现在有一款名为 “OpenDeepWiki” 开源工具,能帮助我们快速理解任何项目的代码结构。

通过 AI 对项目代码进行深度分析,不仅生成直观的 Mermaid 图表展示代码结构,还支持与 AI 进行对话式交互,深入了解代码细节。

GitHub: github.com/AIDotNet/OpenDeepWi

主要功能:

- 几分钟内将任何代码仓库转换为完整知识库;

- 支持所有编程语言的代码分析和文档生成;

- 自动生成 Mermaid 图表展示代码结构和依赖关系;

- 对话式 AI 交互,可实时提问代码相关问题;

- 支持自定义 AI 模型和 API 进行功能扩展;

- 生成 SEO 友好的文档,便于团队分享和检索。

只需通过 Docker 一键部署即可使用,适合需要快速理解代码库的开发者或团队使用。

:icon_weibo: weibo.com/5722964389/PqL16uH70

分享一份全面且实用的论文质检清单:cs-pager-checklist,可让 AI 根据这份清单为我们检查论文。

主要用于检查计算机科学论文(特别是会议和期刊投稿)中的写作质量、结构合理性和内容呈现。

GitHub: github.com/yzhao062/cs-paper-c

总共分为 11 部分检查,从标题摘要到参考文献,每个部分都有具体可操作的检查项,甚至还加入了防止 LLM 引用幻觉的检查提醒。

初次写论文的同学这份检查清单可作为参考,希望能帮助你提高论文被接收的概率。

:icon_weibo: weibo.com/5722964389/PqJwfEItf

跟大家分享一款可作为 Loom 开源平替的跨平台视频录制工具:Cap。

提供桌面客户端和网页版,可以让我们在几秒钟内完成视频的录制、编辑和分享,而且所有数据都可以自托管,完全掌控在自己手中。

GitHub: github.com/CapSoftware/Cap

主要功能:

- 快速录制屏幕内容并立即分享,节省沟通时间;

- 支持视频编辑功能,让内容更专业有条理;

- 完全开源,可自由定制和扩展功能;

- 提供 Dockerfile 和 Railway 一键部署选项;

- 基于 Rust 开发,性能优越且资源占用低。

目前客户端可直接下载使用,支持 macOS 和 Windows 系统,自托管部署可看 README 文件详细介绍。

:icon_weibo: weibo.com/5722964389/PqHtY6eEj

每天盯着孩子做作业,成为每位家长们颇为头疼的事,遇到不会的题还要现学现教,特别是新课标新教材的变化,更是让我们这些家长一头雾水,辅导起来特别费劲。

最近发现的学而思学习机 S4 经典款,它将 21 年专业教研积累的优质内容和强大 AI 工具相结合,专为解救我们这些家长们的烦恼而来。

通过搭载九章大模型与 DeepSeek R1 混合双核 引擎,加上 50+ AI 智能工具,能精准分析孩子的薄弱知识点,智能批改作业,提供针对性练习和讲解,就像一位有耐心的老师 24 小时在线辅导。

主要核心特性如下:

- 全新课标 AI 互动好课,3000+ 清华毕业领衔教研团队精心打造,不仅懂教学还懂学生;

- 王牌练习覆盖巩固、备考、拓展等多种场景,还包含 7 大练习产品,如同步练、错题练、考试练等;

- 好老师领学服务,配备固定真人老师在线带学,全程思路引导,并实时在线答疑;

- 内置 50+ AI 智能工具,精准定位知识漏洞,作业智能批改,提供针对性练习,屏上屏下智能问答;

- 内置小思智能学伴,搭载九章大模型与 DeepSeek R1 混合引擎,有问必答,解析复杂题目,陪伴小孩一起学习成长;

- 毫秒级响应速度,13.2 英寸高清大屏,护眼技术全面升级,保护小孩眼睛。

更重要的是,从启蒙到高中一台就够了,全学科全学段覆盖,对于想要给小孩提供系统学习辅导但时间精力又有限的家长,这款专业减负神器不妨看下。

:icon_weibo: weibo.com/5722964389/PqCncdqHn

分享 GitHub 上一款跨平台的 B 站视频下载开源工具:DownKyicore。

支持批量下载、8K、HDR、杜比视界高清视频下载,并提供音视频提取、去水印等实用工具。

GitHub: github.com/yaobiao131/downkyic

基于 AvaloniaUI 开发,支持 Windows、macOS 和 Linux 系统,提供开箱即用安装包。

:icon_weibo: weibo.com/5722964389/PqApy2Wro

又发现一款将任何 GitHub 代码库生成可视化文档的开源工具:GitSummarize。

只需要输入任何 GitHub 仓库链接,即可一键生成美观且通俗易懂的文档。

GitHub: github.com/antarixxx/gitsummar

不仅提供清晰的项目架构图、流程图、每个目录和文件的概要,还有具体重点业务逻辑处理的介绍。

基于 Gemini 模型生成,适合用来快速了解一个新的开源项目,特别是那些没有 README 文件介绍的项目。

:icon_weibo: weibo.com/5722964389/PqzqF79cI

英伟达开源了一个超强的语音识别模型:Parakeet TDT 0.6B V2,登顶 OpenASR 榜单。

它能够在 1 秒内实现高质量转录 60 分钟的音频,而且参数仅仅 0.6B,轻松击败了所有主流闭源模型。

模型下载:huggingface.co/nvidia/parakeet-tdt-0.6b-v2

排行榜单:huggingface.co/spaces/hf-audio/open_asr_leaderboard

不过目前仅支持识别英文,采用的是 CC-BY-4.0 开源许可,允许商业使用。

:icon_weibo: weibo.com/5722964389/Pqy3qgLRM

Excel MCP Server 这款 MCP 服务器颇为实用,通过 AI 助手直接操作 Excel 文件,或许不用再装微软 Excel 办公软件了。

目前已经实现创建、读取和修改 Excel 表格数据,甚至还能应用格式、创建图表和透视表,相当于拥有一个专业的 Excel 助手。

GitHub: github.com/haris-musa/excel-mc

可通过 Cursor、Claude 等 MCP 客户端使用,感兴趣的同学可以试试。

:icon_weibo: weibo.com/5722964389/Pqsa77IYg

每天面对一堆任务和目标,却总是注意力分散,加上拖延症作祟,眼看着待办清单越来越长,却始终无法高效执行。

面对这些痛点,给大家推荐一款高效的生产力工具:karman ,它用极简界面和三大核心功能,帮我们重拾专注力和执行力!

基于 Flutter 开发,干净简洁的任务管理系统、习惯养成追踪和番茄工作法计时器,而且开源免费且不收集任何用户数据,让我们更专注于重要的事。

GitHub: github.com/surtecha/karman

主要功能:

- 简洁直观的任务管理,轻松组织和优先处理待办事项;

- 习惯养成追踪功能,建立长期可持续的日常良好习惯;

- 内置番茄工作法计时器,提升专注力和深度工作能力;

- 极简设计理念,消除一切可能分散注意力的元素;

- 注重隐私保护,不收集或追踪用户数据。

可通过 GitHub 发布页面或 Google Play 商店,下载安装包安装即可使用。

:icon_weibo: weibo.com/5722964389/PqqZpkqUf

又发现了一款强大的 Deep Research 开源平替工具,主打一个快速!

仅需 2 分钟即可生成一份全面的深度研究报告,结合了 “深度思考” 和 “联网”,支持多种主流大模型,通过各种搜索引擎获取最新信息。

GitHub: github.com/u14app/deep-researc

除此之外,还支持内容编辑,可调整阅读难度、文章长度和全文翻译等,所有数据本地处理和存储,保障隐私安全。

允许一键部署到 Vercel 和 Cloudflare,也支持 Docker 本地快速部署,有需要的可以试试。

:icon_weibo: weibo.com/5722964389/PqiJCciRg

在阅读 PDF 英文论文时,常常会被各种专业术语或复杂表达卡住,于是来回进行查看翻译,特别影响阅读效率。

如果你刚好在使用 Zotero 这款开源的文献管理工具,建议搭配这款 PDF2zh 翻译插件。

它能帮助我们一键将整篇论文翻译成中文,还能保留原文进行对照学习,支持多种翻译服务,同时还能处理数学公式,甚至能将双栏论文转为单栏方便在手机上阅读。

GitHub: github.com/guaguastandup/zoter

主要功能:

- 一键翻译英文 PDF 论文,支持仅中文或中英双语对照格式;

- 翻译时自动保留数学公式和图表,不影响论文排版;

- 支持多种翻译引擎,包括 Bing、DeepSeek、智谱等;

- 智能将双栏论文转为单栏,极大提升手机阅读体验;

- 可自定义中文字体,推荐使用霞鹜文楷提升可读性。

使用教程,先通过本地代码或 Docker 部署安装 PDF2zh 和 配置翻译服务,然后再到 Zotero 工具配置插件参数,在 README 文件上提供了详细教程,有需求的可以看下。

:icon_weibo: weibo.com/5722964389/Pqi95emUT

通常我们在面试前,会对即将面试的公司进行了解,在国内可使用天眼查,但想查看完整信息需要支付高额费用,而自己去查又费时费力。

给大家推荐使用 Agentic Company Researcher 这个开源项目,一键自动生成全面公司研究报告。

它集成多个 AI 智能体分别从公司网站、新闻、财报等多种来源收集信息,并结合 Gemini 和 ChatGPT 大模型进行内容筛选与合成,生成一份高质量报告。

GitHub: github.com/pogjester/company-r

主要功能:

- 多源数据自动收集,整合公司网站、新闻和财报信息;

- 基于 Tavily 的 AI 内容筛选,确保信息相关性;

- 实时进度流式传输,随时查看研究进展;

- 双模型架构,Gemini 处理大量数据,GPT-4.1 负责精确排版;

- 现代化 React 前端界面,支持实时更新和下载;

- 模块化智能体架构,支持灵活扩展和定制。

可通过克隆代码到本地,并简单配置下 API Key,即可使用。

:icon_weibo: weibo.com/5722964389/PqhyykQON

每次看到有新出的大模型都想部署使用,但往往需考虑自己电脑配置是否够用,别辛辛苦苦部署完推理速度确慢得像蜗牛一样,甚至不能用浪费精力与时间。

在此给大家推荐一款能直观预估大模型部署所需的硬件资源的工具:LLM Inference VRAM Calculator。

通过简单设置模型类型、量化精度、批处理大小等参数,就能实时计算出所需显存、生成速度和吞吐量,甚至能看到详细的内存分配情况和多 GPU 扩展性能。

在线使用:apxml.com/tools/vram-calculator

而且上面可选择的模型紧跟主流,包含最新的 Qwen3 系列模型。想要部署大模型又担心硬件不足的开发者可以先到这里预估参考看下。

:icon_weibo: weibo.com/5722964389/Pqhaco4Ev

分享 GitHub 上一份精心整理的机器人模拟器资源列表:best-of-robot-simulators。

涵盖了 9 大类共 110 个优秀工具,包含通用机器人模拟器、2D 模拟器、物理引擎、无人机模拟器等类别。

GitHub: github.com/knmcguire/best-of-robot-simulators

列表中的项目按照 Star、Fork 、Issue 数量以及 Commit 提交活跃数进行质量评分排序,同时保持每周更新,方便大家快速找到优质项目。

如果你是一名机器人模拟器开发者,相信这份资料合集对你有一定帮助,节省了大量筛选时间。

:icon_weibo: weibo.com/5722964389/PqgzFrfw3

平时在处理论文、报告、产品文档这类资料时,为了找到特定信息往往需要逐页查找,或者依赖传统搜索工具,特别是处理大量文档时更是耗时又费力。

面对这一困境,Kotaemon 这个开源项目让我们能直接与文档进行对话,通过聊天方式即可提取所需的各种信息,彻底改变了我们与文档交互的方式!

它采用混合检索技术结合大语言模型,在提供答案的同时还会附上详细引用和文档预览,支持表格和图片识别,甚至能够处理复杂推理需求,让检索体验更精准高效。

GitHub: github.com/Cinnamon/kotaemon

主要功能:

- 支持多用户登录,可将文件整理成私人/公共集合并分享

- 兼容流行的 API 服务商和本地 LLM 模型,保护隐私数据

- 多模态文档解析,支持提取图表和表格中的信息

- 高级引用系统,在浏览器中直接预览原文并高亮相关内容

- 复杂推理支持,能够处理多步骤问题和复杂查询

- 可定制设置界面,允许调整检索和生成过程的关键参数

只需通过 Docker 或 Python 环境安装即可使用,支持本地部署保护敏感数据。

:icon_weibo: weibo.com/5722964389/Pq8IAsPhl

一份精心收集整理的系统设计面试资源列表:system-design,已狂揽 15.4k Star!

旨在帮助大家通过系统设计面试,并提供很多知名科技公司的实战案例,如实时游戏排行榜、缓存一致性、实时协作、数据库迁移策略等。

GitHub: github.com/systemdesign42/syst

另外,还收集了很多有关系统设计的基础知识,以助大家学习。

:icon_weibo: weibo.com/5722964389/Pq883tNKv

在 GitHub 上发现一份从零开始学习机器学习算法教程:Machine-Learning。

包含了神经网络和 Transformer 模型的详细解释,以及关键的 Python 实现代码,如 Neuron、Layer 和 NeuralNetwork 类。

GitHub: github.com/DorsaRoh/Machine-Le

此外,还提供了关于机器学习的视频格式内容和相关的 Jupyter Notebook 文件。

:icon_weibo: weibo.com/5722964389/Pq7Q1kfik

分享 GitHub 上一份收集整理了一站式的大模型微调笔记合集: Unsloth Notebooks。

提供 40+ 份笔记,涵盖了从 Llama 3 到 Phi 4、Mistral、Qwen 2.5 等几乎所有主流开源模型,每个笔记本都有详细的注释和指南,便于我们直接上手微调训练模型。

GitHub: github.com/unslothai/notebooks

主要内容:

- 按模型类型分类的微调笔记本(Llama、Phi、Mistral、Qwen、Gemma 等)

- 多种训练方法(GRPO、DPO、Alpaca、会话微调等)全覆盖

- 视觉模型专用笔记本(Llama 3.2、Qwen 2.5 VL 等)

- 语音合成模型训练资源(如 Orpheus TTS)

- 所有笔记本都为 Colab 和 Kaggle 环境优化

只需点击相应的链接即可开始测试,想快速入门与实践大模型微调的开发者值得一看。

:icon_weibo: weibo.com/5722964389/PpZ5UBJXz

Show older
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。