GitHub 上一款好用稳定的全平台通用换源工具与框架:chsrc。
仅需一行命令实现自动切换到可用镜像源,内置 60+ 源地址,确保能切换到可用源。
GitHub: https://github.com/RubyMetric/chsrc
支持 Linux、Windows、macOS、BSD 等众多操作系统环境。
还支持测速、项目级换源等功能,适用于优化下载速度或解决源受限的场景。
分享 GitHub 上一款功能全面且好用的跨平台日记应用:Moodiary。
不仅支持丰富的记录形式(文字、图片、音频甚至绘画),还提供了本地 AI 分析功能,确保我们的隐私数据不会被上传到第三方服务器。
GitHub: https://github.com/ZhuJHua/moodiary
主要特性:
- 全平台支持,覆盖 Android、iOS、Windows、MacOS、Linux;
- 多种编辑器,支持 Markdown、纯文本和富文本编辑;
- 丰富媒体附件,可添加图片、音频、视频和绘画;
- 数据安全,支持密码保护和生物识别解锁;
- 智能助手,支持本地 NLP 和第三方大模型接入;
- 足迹地图,在地图上查看你的生活轨迹。
可通过下载 Release 中的安装包直接安装,也支持手动编译,适合注重隐私且希望跨设备记录生活的同学使用。
在使用 TensorFlow、PyTorch 这类主流机器学习库时,它们像个黑盒子,里面的算法实现和数学原理看不见摸不着,学习起来颇为痛苦。
现在可以通过 SmolML 开源项目学习机器学习,用纯 Python 从零实现各种 ML 算法,通俗易懂地了解机器学习工作原理。
它不依赖 NumPy 等外部库,完全用原生 Python 构建了自动微分引擎、多维数组和各种经典模型,将复杂的黑盒变成了透明的教学工具。
GitHub: https://github.com/rodmarkun/SmolML
主要内容:
- 完全透明的自动微分引擎和多维数组实现;
- 各种预处理工具和优化器的底层原理展示;
- 从零构建神经网络、决策树和 K-Means 等经典模型;
- 专注教育目的,代码注重清晰度而非性能;
- 丰富的教程指导我们理解每个 ML 组件。
提供了详细的图文并茂教程,我们只需要按顺序学习即可,适合想深入理解 ML 原理的同学学习。
在处理视频时经常被各种格式问题搞得头大,一些设备不支持某些格式,或者文件太大传不上云盘,找付费软件又特别贵,免费的又功能太少。
寻找解决方案时,发现了 HandBrake 这款开源视频转码工具,一键将视频转换成各种格式,轻松解决格式兼容问题!
它支持从几乎任何来源(DVD、蓝光、视频文件)转换视频,提供丰富的预设配置适合不同设备,还能通过智能编码算法大幅压缩文件体积同时保持画质。
GitHub: https://github.com/HandBrake/HandBrake
主要功能:
- 支持从 DVD、蓝光和各种视频文件转换视频;
- 为 iPhone、Android、AppleTV 等主流设备提供优化预设;
- 内置多种编码器包括 H.265 和 VP9,支持硬件加速;
- 可调整字幕、章节和视频参数(分辨率、帧率等);
- 提供强大的视频过滤器(降噪、去交错、裁剪等);
- 批量转码功能,一次处理多个文件。
在官网或 GitHub 发布页面下载安装包即可使用,兼容 Windows、Linux 和 macOS 系统。
来自麻省理工学院(MIT) 开源的一门免费课程:Flow Matching and Diffusion Model,从零开始带我们构建完整的扩散模型。
通过三个精心设计的实验练习,循序渐进地引导我们实现流匹配和扩散模型,从基础 SDE 到条件图像生成,每一步都有详尽指导和完整代码,让复杂理论简单易懂。
GitHub: https://github.com/eje24/iap-diffusion-labs
主要内容:
- 全面讲解流匹配和扩散模型的数学基础和理论框架;
- 三个循序渐进的实验练习,从零构建完整的图像生成扩散模型;
- 包含详细的课程笔记、幻灯片和操作指南,自学友好;
- 覆盖图像、视频、分子结构等多种数据模态的生成原理;
- 配套 Colab 笔记本环境,无需复杂环境配置。
学习该课程需要基本的线性代数、概率论和 Python 基础,适合想要深入了解生成式 AI 底层原理的开发者。
一款开源免费且超实用的 Windows 小工具:ScreenToGif,轻松录制屏幕、摄像头和内置画板。
提供简洁易用的界面,可以录制屏幕上任意区域,然后用内置编辑器剪裁、添加文字和特效,最终保持为 GIF、视频或其他格式的文件。
GitHub: https://github.com/NickeManarin/ScreenToGif
主要功能:
- 灵活录制屏幕任意区域、摄像头画面或使用内置画板;
- 强大内置编辑器,支持帧控制、特效添加和文字插入;
- 多种导出格式:GIF、APNG、视频、PSD 或 PNG 图像;
- 键盘捕捉功能,可在录制中显示按键操作;
- 可调整帧率和质量设置,优化文件大小。
提供开箱即用安装包,可通过 GitHub 发布页面直接下载,或到微软应用商店搜索安装使用。
在 GitHub 上有位开发者整理了一份国内所有小初高、大学课程的 PDF 教材:ChinaTextbook。
提供了高清无水印的 PDF 文件,可供大家免费下载,旨在杜绝某宝上带有水印的付费资源。
GitHub: https://github.com/TapXWorld/ChinaTextbook
同时也希望海外华人能够让自己的孩子继续了解国内资源,促进义务教育的普及。
分享一份精心整理的好用、优秀的 Windows 应用列表:Best Windows Apps。
涵盖了文件管理、截图录屏、笔记应用、Markdown 编辑器、系统优化、终端工具、抓包工具、设计工具、摸鱼神器等等相关工具。
GitHub: https://github.com/stackia/best-windows-apps
希望这份应用列表,能帮助到大家优雅地使用 Windows 系统,解放双手提升效率。
开会或听重要讲座时,记下的零星笔记,事后常常会忘记关键信息,颇为烦恼,然而用第三方的转录工具又担心隐私安全问题。
最近发现 GitHub 上一款开源免费的 AI 会议助手:Speakr,能解决了这个问题。
它能够完全离线运行,把我们会议录音转成文字、生成摘要,还能让我们通过聊天方式进行内容问答,所有数据都保持到本地安全隐私。
GitHub: https://github.com/murtaza-nasir/speakr
主要功能:
- 支持拖放上传各种格式音频文件(MP3、WAV、M4A)进行转录;
- 自动生成简洁标题和会议内容摘要,帮助快速理解重点;
- 通过聊天界面提问,与会议内容进行交互式对话;
- 内置搜索、收件箱和高亮功能,方便查找和处理关键信息;
- 支持深色模式和完整的用户管理系统;
- 提供强大的管理员面板,可查看系统统计和管理用户。
通过 Docker 一键部署,只需要几分钟即可使用,比较适合那些对数据隐私比较注重的同学使用。
搭建和管理网站时,配置 Nginx 或 OpenResty 往往需要编写复杂的配置文件,还要手动设置 SSL 证书,颇为繁琐。
最近发现一个 OpenResty Manager 开源项目,强大且美观易用的 OpenResty 管理面板。
它提供了可视化界面来设置反向代理、免费 SSL 证书、访问控制和 HTTP 防洪等功能,不需要了解 OpenResty 的内部工作原理,告别繁琐命令就能轻松管理多个网站。
GitHub: https://github.com/Safe3/openresty-manager
主要功能:
- 一键申请免费 SSL 证书,支持 HTTP-01 和 DNS-01 验证方式;
- 简单几步配置反向代理,轻松管理多个网站;
- 内置访问控制和 HTTP 防洪等安全功能保护网站;
- 美观易用的 Web 管理界面,无需懂技术也能操作;
- 支持高级配置选项,满足专业用户需求。
只需要一行命令即可完成安装,同时支持主机和 Docker 两种部署方式,有需要的试试。
平时管理服务器,总是被绑在电脑前面,一旦出门就无法及时查看状态或处理问题,尤其是遇到紧急情况时焦虑与无助感,相信每位运维工程师都遇到过。
偶然间,发现了 Flutter Server Box 这款全平台工具箱,能让我们管理服务器变得随时随地都能进行。
它使用精美的状态图表展示服务器关键信息,并集成了 SSH 终端、SFTP 文件管理、Docker 容器和进程管理等核心功能,一个 App 就能搞定所有操作。
GitHub: https://github.com/lollipopkit/flutter_server_box
主要功能:
- 实时监控 CPU、传感器、GPU 等关键指标,直观掌握服务器健康状态;
- 内置 SSH 终端,随时执行命令不受设备限制;
- SFTP 文件管理,轻松上传下载和编辑服务器文件;
- Docker 容器、进程和 Systemd 服务一键管理;
- 支持生物认证、推送通知和桌面小部件,体验更安心便捷;
- 多平台支持,包括 iOS、Android、Linux 和 Windows 全覆盖。
通过 AppStore 或 GitHub 下载安装即可使用,如果你是一名运维工程师值得看下这款工具。
跟大家分享一款无需 OCR 就能从各类文档中提取结构化信息的本地化开源工具:docext。
利用视觉语言模型(VLM)来识别和提取文档中的字段数据和表格信息,既准确又能保证数据安全隐私。
GitHub: https://github.com/NanoNets/docext
主要功能:
- 灵活提取自定义字段,支持使用预建模板;
- 智能提取文档中的表格数据,保持原始结构;
- 为所有提取的信息提供置信度评分;
- 完全本地部署,支持 Linux 和 MacOS 系统;
- 处理多页文档,无需分页处理;
- 提供 REST API,方便与现有应用集成。
另外,还内置了常见文档类型的模板,适合需要大量处理发票、护照等这些敏感信息的应用场景。
GitHub 上 Awesome-Large-Multimodal-Reasoning-Models 这个开源项目,为我们提供了一个完整的多模态推理模型发展全景图。
来自哈尔滨工业大学(深圳)研究人员,通过综述分析了 550 多篇论文后,构建了从基础模块到高级推理的四阶段发展路线图,清晰展示了多模态推理模型从感知驱动到语言中心再到原生推理的完整演进历程。
GitHub: https://github.com/HITsz-TMG/Awesome-Large-Multimodal-Reasoning-Models
主要内容:
- 系统梳理多模态推理模型的四阶段发展历程(感知驱动、语言中心短推理、语言中心长推理、原生多模态推理);
- 全面收集相关数据集和基准测试,覆盖多模态理解、生成、推理和规划四大类;
- 分析 OpenAI-o3 和 o4-mini 等前沿模型的实验性能和能力边界;
- 探讨原生多模态推理模型(N-LMRMs)的未来发展和技术前景;
- 提供详尽的模型表格比较,包括不同阶段的代表性工作及其特点;
- 配有直观的图表说明,帮助我们更好理解各类模型的演进关系。
这份资料总结了相当全面,能很好帮助我们理解整个 AI 大模型发展路线,值得一看。
分享一份采用 DACA 设计模式从零开始学习 Agentic AI 的教程:Learn Agentic AI,
以 OpenAI Agents SDK 为基础框架,并结合 Dapr 分布式技术栈,从三个层次的课程教授从基础到高级的全栈智能体型 AI 开发,包括容器化部署和 Kubernetes 扩展。
GitHub: https://github.com/panaversity/learn-agentic-ai
主要内容:
- 完整的 DACA(Dapr Agentic Cloud Ascent)设计模式解析与实践;
- 从零开始学习 OpenAI Agents SDK 开发智能体 AI 应用;
- 基于 Dapr 的分布式智能体系统架构与实现细节;
- 三个阶段式课程,从基础理论到行星级规模部署;
- Kubernetes 容器编排与云原生智能体 AI 开发流程;
- 包含模型上下文协议(MCP)和智能体间通信协议(A2A)实现。
项目提供了完整的视频教程和实践指南,同时课程中涉及到的代码示例均已开源,提供 .ipynb 文件可直接运行。
在开发游戏或大型应用时,经常会遇到难以查找的性能瓶颈问题,一旦程序变慢,定位具体原因简直就像大海捞针,特别让人头疼。
给大家推荐一款截止目前已斩获 11.5k Star 的实用开源工具:Tracy Profiler,能以纳秒级精度实时分析应用性能,轻松帮助我们找出性能瓶颈所在。
支持同时分析 CPU、GPU、内存分配、锁和上下文切换等多个维度,还能自动将截图与捕获的帧关联起来,为我们提供全方位的性能监控视图。
GitHub: https://github.com/wolfpld/tracy
主要功能:
- 纳秒级精度的实时性能分析,捕获最细微的性能问题;
- 支持所有主流图形 API(OpenGL、Vulkan、DirectX、Metal 等);
- 多语言支持,包括 C、C++、Lua、Python 和 Fortran 等;
- 内存分配、锁使用和上下文切换的详细追踪;
- 直观的可视化界面,让性能数据一目了然;
- 自动将截图与捕获帧关联,方便分析特定场景。
通过简单的 API 集成即可使用,如果你是一名游戏开发者或追求极致性能的软件工程师,这款工具不妨看下。
在 GitHub 上发现一个能满足 8090 后怀旧感的开源项目:FieldStation42。
它能完美模拟传统有线和广播电视的观看体验,根据当前时间自动播放对应的节目,在频道之间切换时,节目会像真实电视台一样继续播放。
甚至还会自动插入广告和频道标识,仿真度极高,让我们重温那个按时守候电视节目的年代!
GitHub: https://github.com/shane-mason/FieldStation42
主要功能:
- 支持多个同时播放的频道,能无缝切换;
- 自动生成每周节目表,内容新鲜不重复;
- 智能插入广告和频道标识,还原真实;
- 支持电影长度内容和季节性节目设置;
- 支持循环播放的社区公告频道;
- 可配置预览/指南频道,显示当前播放内容。
安装需要一定的 Linux 基础和视频文件处理经验,在 README 文件上提供了详细教程,并且简述了其工作原理,感兴趣的可以看下。
一款能媲美 Suno 的开源音乐模型:ACE-Step,能在极短时间内生成高质量音乐,比传统 AI 模型快 15 倍!
通过结合扩散生成模型和轻量级 Transformer,同时在训练中利用 REPA 技术实现语义对齐,实现生成的音乐既保持高度连贯性,又能精确对齐歌词。
GitHub: https://github.com/ace-step/ACE-Step
主要功能:
- 一键生成完整音乐作品,支持 19 种语言和各种音乐风格;
- 声音克隆、歌词编辑、混音等高级控制机制,灵活调整音乐细节;
- 专用 LoRA 模型可从歌词直接生成人声样本,加速作曲流程;
- 局部重绘功能可选择性修改特定部分,无需重新生成整首歌曲;
- 提供歌词到人声、文本到采样、即将推出的说唱机器和声轨生成等功能;
- 高效性能设计,在 A100 GPU上仅需 20 秒即可合成 4 分钟的音乐;
模型下载:huggingface.co/ACE-Step/ACE-Step-v1-3.5B
在线体验:huggingface.co/spaces/ACE-Step/ACE-Step
目前项目代码和模型均已开源,并且提供了 ComfyUI 节点,方便大家快速使用。
分享 GitHub 上一款精美的代码截图分享开源工具:chalk.ist。
通过简单粘贴代码,选择主题和样式,即可一键生成带有语法高亮的精美代码图片,支持多种编程语言。
GitHub: https://github.com/Idered/chalk.ist
除此之外,还可以添加自定义背景、行号和各种装饰效果,最后可一键导出 PNG 格式图片进行分享。
对于经常需要在社交媒体或编写技术文章中展示代码的同学,该工具值得一试。
如果你使用苹果电脑,不妨看下这款增强预览能力的开源工具:QuickLook Video。
添加了对 .flv、.mkv、.webm 等众多 “非原生” 视频格式的支持,让我们能直接预览几乎所有类型的视频文件。
GitHub: https://github.com/Marginal/QLVideo
主要功能:
- 在 Finder 中显示各种格式视频的缩略图和预览;
- 支持查看视频封面艺术和元数据信息;
- 兼容大量非原生媒体文件类型;
- 无需打开专门的播放器即可预览视频内容;
- 与 macOS 系统完美集成,操作体验一致。
可通过 GitHub 发布页面下载安装包,安装后立即生效,无需额外配置。
平时下载了各种有声书和音频课程,但在手机上听一半换到平板或电脑继续听时,总要手动记住上次听到哪里,特别麻烦。
最近发现的 Folder2Podcast 开源项目解决了这个困扰,它能把我们本地的音频文件夹秒变成私人播客 RSS 源,让跨设备听书变得超简单!
实现零侵入读取本地音频文件,并自动生成标准播客 RSS 订阅源,而且完美兼容 Apple Podcasts、Pocket Casts 等各种主流播客客户端。
GitHub: https://github.com/yaotutu/folder2podcast
主要功能:
- 零侵入设计,不修改原始文件夹结构和内容;
- 自动分析文件名构建剧集顺序,智能生成发布时间;
- 完美支持所有主流播客客户端,享受专业听书体验;
- 跨设备同步收听进度,随时随地接着上次位置听;
- 提供友好的 Web 界面,一键复制订阅地址;
- 支持播客元数据自定义,个性化配置封面和信息。
可通过 Docker 一键部署,简单配置下即可使用,并且提供了详细教程,特别适合喜欢有声书和播客的同学使用。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报