跟大家分享一个超实用的前端工具百宝箱:Assorted tools。
国外一名 Simon 开发者,几乎全靠 AI 的帮助下构建的这套实用的 HTML + JavaScript 工具集,同时 Simon 详细记录了其如何利用 LLM 快速构建这些小工具的过程。
GitHub: https://github.com/simonw/tools
来看看都有那些实用的工具:
- 直接在浏览器里完成 PDF 和图片 OCR 识别,不用担心隐私问题。
- 一系列超方便的图像处理工具:SVG 转换、社媒图片裁剪、EXIF 数据查看等。
- 开发者必备的格式转换工具:JSON/YAML 互转、SQL 美化、Markdown 渲染等。
- 日常开发辅助神器:时间戳转换、多时区比较、PHP 数据反序列化等。
- AI 研究利器:Claude Token 计数、Gemini 图像可视化、OpenAI 音频输出等。
利用 AI 构建每个工具的对话过程,Simon 都详细记录并分享在 GitHub,值得我们学习。
分享 GitHub 上一款高效便捷的音频转文字工具:SoftWhisper。
基于 Whisper.cpp 实现,依赖极少,且支持 CPU+GPU 加速,大幅提升了转录速度,相比 OpenAI 的 Whisper 快了数十倍,2 小时音频仅需 2-3 分钟即可完成转录。
GitHub: https://github.com/NullMagic2/SoftWhisper
而且该工具简单易用,Windows 可以开箱即用,自动下载所需模型,无需复杂配置。
分享 GitHub 上一份专为 LLM 工程师精心整理的资源工具集:LLM Engineer Toolkit。
包含 120+ 个按类别分类的 LLM 相关工具,涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。
GitHub: https://github.com/KalyanKS-NLP/llm-engineer-toolkit
对于刚接触 LLM 开发或需寻找特定工具的开发者来说,这份工具清单,值得收藏。
在 GitHub 上发现一个颇有意思的开源项目:worth-calculator。
通过一系列计算公式,计算出我们当前工作的性价比分数,看到底 “值不值得” 上这个班。
GitHub: https://github.com/zippland/worth-calculator
具体能算以下几项信息:
✅ 到手工资: 基于年薪和实际工作天数算出真实日薪。
✅ 时间成本: 上班时长、通勤时间、各种假期都考虑进去了。
✅ 工作环境: 从工位到同事,全方位评估。
✅ 最终结果: 给你一个直观的参考指标。
分享 GitHub 上一个可快速将 Coze Bot 接入到微信的开源项目:Coze on WeChat。
允许将 Coze 平台上开发的 AI 机器人快速无缝接入微信,支持文本聊天、语音交互以及插件等功能。
GitHub: https://github.com/JC0v0/Coze-on-Wechat
除此之外,还提供 Web 后台管理界面,方便配置和管理机器人。
现在看到越来越多的人开始用 AI 来搭建知识库。确实,对比传统方式,AI 知识库在内容检索和信息整合方面,有着得天独厚的优势。
因此,不少企业会用 AI 来搭建智能客服、公司内部知识库、产品文档问答、学术研究与教育等等场景。
今天给大家推荐 GitHub 上 一款开源的 AI 知识库问答系统:MaxKB,它凭借着简单易用且功能强大的特点脱颖而出。
可直接开箱即用,上传 PDF、Word 文档或输入网址一键爬取,系统会自动处理并立即具备 AI 问答能力。
GitHub: https://github.com/1Panel-dev/MaxKB
相比其他知识库,它能更加精准理解问题含义并给出完整解答,而不只是返回可能相关的文档链接。
同时支持接入多种大模型,包括 DeepSeek R1、Llama 3、OpenAI 等,让我们可以根据自身隐私和成本需求灵活选择。
分享 GitHub 上一款可以在 Mac 上完全离线运行的本地 AI 助手:Sidekick。
无需安装其他辅助软件,实现在与本地 LLM 聊天时可以从我们的文件、文件夹和网站中获取信息,所有对话都在离线环境中进行,保证数据安全。
GitHub: https://github.com/johnbean393/Sidekick
主要功能:
- 支持文件、文件夹和网站作为知识来源,可创建不同专业领域的”专家”模式;
- 内置代码解释器,大幅提升模型的数学和逻辑能力;
- 支持文本生成图像,可自动识别图像生成提示并生成;
- 内联写作助手,按下快捷键直接在 Word 中使用;
- 支持渲染 LaTeX、数据可视化和代码高亮,支持一键导出。
感兴趣的同学可通过在 Releases 页面下载安装包体验。 #AI创造营
分享 GitHub 上一款强大的 AI 研究助手:Local Deep Research。
这是一个可以在本地运行的 AI 助手,能执行深度、迭代式研究分析,支持多种 LLM 和网络搜索,既保障隐私又提供强大的研究能力。
GitHub: https://github.com/LearningCircuit/local-deep-research
主要特性:
- 自动进行深度研究并提出智能跟进问题,追踪和验证引用来源
- 支持本地 AI(Ollama 模型)和云端 LLM(Claude、GPT)灵活切换
- 集成多种搜索引擎,如维基百科、arXiv、PubMed 等,自动选择最佳搜索源
- 支持本地文档搜索(RAG),可创建自定义文档集合进行私密检索
- 提供详细研究结果和报告,包含引用和来源跟踪
安装配置简单,并提供终端和网页界面两种使用方式。 #AI创造营
分享 GitHub 上一款能为大模型提供浏览器自动化能力的工具:Playwright MCP Server。
通过模型上下文协议(MCP)服务器,让 LLM 可以与网页交互、截取屏幕截图、在真实浏览器环境中执行 JavaScript,实现智能 AI 网页浏览和操作。
GitHub: https://github.com/executeautomation/mcp-playwright
主要功能:
- 为 Claude 等 LLM 提供浏览器自动化能力
- 支持与网页交互、表单填写和导航操作
- 能够截取网页截图,帮助 AI 理解网页内容
- 支持在浏览器环境中执行 JavaScript 代码
- 集成 Smithery 和 mcp-get 等工具,简化安装配置
提供多种安装方式,而且对 Claude Desktop 兼容性最好,有需要的可以试试。
分享 GitHub 上一份面向大模型算法岗求职者的面试题集合:FAQ_Of_LLM_Interview。
这是一个包含大模型应用基础、优化技术、分布式训练、高效微调等内容的综合资料库,涵盖了从基础概念到实战应用的全方位知识点。
GitHub: https://github.com/aceliuchanghong/FAQ_Of_LLM_Interview
内容全面且实用,包括面试必问问题、实际面试经验总结、代码实践等,还有 PyTorch 搭建神经网络、Transformer 模型结构等核心知识点。
适合准备大模型算法岗面试的开发者和对 LLM 领域感兴趣的学习者参考学习。
跟大家分享一款全能的 AI 助手:夸克 AI。
带来了一个 “AI 超级框”,集成深度思考 AI 搜索、AI 写作、解题答疑、AI 生图、制作 PPT 等多种功能,实现 “一框解决所有需求”。
主要特性:
- 智能识别用户意图,精准完成不同类型任务,不再用同一方式回复所有问题;
- 支持连续多轮追问,保留上下文关联,用日常语言就能获得精准答案;
- 搜题时展示完整思考过程,帮助学习各学科思维方式,还有极速拍题模式;
- AI 写作支持 200+ 种体裁,可上传 5 万字参考材料,支持一键润色、扩写等功能;
- 医疗搜索由近 400 位顶级专家编审,与 60+ 医学协会合作,提供科学严谨的专业解答;
- 学术科研支持 6000 万+ 中文文献全文,亿级中外文献,与知网等平台合作。
地址: https:// 网页链接
目前该功能已上线全平台客户端,点击首页 “搜索框” 即可使用,感兴趣的同学可以下载体验下。
在看到今天夸克的全面升级后,夸克已不再是我们熟悉的网盘了。
它本次升级将传统的搜索框变成了 “AI 超级框”,不仅能深度思考识别我们意图,还能帮我们完成 AI 写作、学术搜索、AI 生图等不同需求场景。
比如我让它为我写一篇文章,搜索框简单输入主题,夸克 AI 瞬间在全网搜索相关资料并输出一篇文章,我们还能进行扩写、润色,甚至自己编辑等。
此外,它还有一个对学生、老师、家长很实用的功能,遇到不同的数学题截图发给它,即可输出详细的解题步骤。
总的来说,夸克已成为了不错的 AI 助手,基本满足我们日常学习、工作和生活需求,感兴趣的同学可以下载体验下。
地址: https:// 网页链接
众所周知,Jellyfin 是一款颇受欢迎的开源影音管理工具,能让我们随时随地掌控自己的媒体库,目前在 GitHub 上已斩获 37.8k Star。
近日,在 GitHub 上发现了一款简洁易用的 Jellyfin 移动客户端应用:Streamyfin。
这是一个基于 Expo 构建的移动应用,提供了许多其他 Jellyfin 客户端所没有的功能,让媒体流媒体体验更加完善和便捷。
GitHub: https://github.com/streamyfin/streamyfin
主要功能:
- 支持跳过片头/片尾功能,优化观影体验
- 提供视频预览缩略图,拖动进度条时更直观
- 后台音频播放,锁屏状态下也能继续播放音乐
- 实验性媒体下载功能,支持离线观看保存的内容
- 实验性投屏功能,可投射到支持的智能电视和设备
- 集成媒体请求功能,支持在应用内直接请求新内容
已上架 App Store 和 Google Play 商店,Android 用户也可从 GitHub 下载 APK 安装包。
分享 GitHub 上一款能自动跳过应用广告的开源工具:GKD。
基于 Android 无障碍服务,可自动检测并点击 “跳过” 按钮,比如开屏广告、应用内弹窗以及各种骚扰推广等。
GitHub: https://github.com/gkd-kit/gkd
主要功能:
- 自动点击跳过开屏广告,无需手动等待
- 自动关闭应用内弹窗广告,保持浏览流畅
- 支持本地规则和远程订阅规则,完全自定义拦截内容
- 无需 root 即可使用,操作简单友好
安装简单,下载 APK 后只需授予无障碍权限即可使用。
分享 GitHub 上一份系统且全面的 Prompt 越狱手册:PromptJailbreakManual。
这份手册不仅详解 Prompt 构建本质与思维模式,还提供丰富的攻防实例和框架模板,帮助解决 AI 使用过程中的各种挑战。
GitHub: https://github.com/Acmesec/PromptJailbreakManual
内容包括:
- 从思维模式角度剖析 Prompt 设计本质,强调 “极致简洁输出“ 理念;
- 提供全面的 Prompt 设计技巧与优化迭代方法,覆盖各种使用场景;
- 深入探讨 Prompt 注入、泄露与越狱技术,包含多种越狱框架案例;
- 结合 Google、LangGPT 等框架,打造专属漏洞助手的实战案例。
来自 Cloudflare 开源的一套 AI 开发框架:Cloudflare Agents。
这是一个用于构建智能、有状态的 AI 智能体框架,让 AI 智能体能够在网络边缘持久化存在、思考和进化,开创了 AI 开发的新范式。
GitHub: https://github.com/cloudflare/agents
主要特性:
- 核心智能体框架支持状态管理和持久化内存
- 支持 WebSocket 实时通信功能
- 提供 HTTP 端点和路由能力
- 集成 React 钩子,方便前端开发
- AI 智能体支持休眠与唤醒机制,资源利用更高效
- 可在 Cloudflare 全球边缘网络上大规模运行
分享 GitHub 上一款自动提取 YouTube 视频时间戳和转录内容的工具:YTM (YouTube Transcripts Machine)。
只需粘贴任何 YouTube 视频 URL,即可获取完整转录文本及交互式时间戳,支持一键复制和下载功能。
GitHub: https://github.com/zaidmukaddam/youtube-transcripts-machine
主要功能:
- 简单输入:只需粘贴任何 YouTube 视频 URL 即可提取转录内容
- 带时间戳的转录:查看带有准确时间标记的完整转录文本
- 交互式时间戳:点击任何时间戳可以跳转到视频的确切位置
- 导出选项:复制整个转录到剪贴板或下载为文本文件
- 响应式设计:在桌面和移动设备上无缝工作
通过 Vercel 一键部署,需要配置 OpenAI API 密钥和 BrowserBase 凭据,也支持自定义使用 Anthropic 或其他 LLM 模型。
分享一门学习 LangGraph 基础知识的免费教程:LangGraph 101。
由 LangChain 团队精心设计的学习资源,通过一系列 notebooks 帮助我们掌握 LangGraph 框架,专为构建精确可控的 AI 智能体和多智能体应用而设计。
课程:academy.langchain.com/courses/intro-to-langgraph
共有六大章节,如下:
- 章节 1:介绍(包含简单图、Studio、Chain、Router 和 Agent)
- 章节 2:状态与内存(状态管理、消息处理与聊天机器人构建)
- 章节 3:UX 与人机交互(流式处理、断点和状态编辑)
- 章节 4:构建助手(并行化、子图和研究助手)
- 章节 5:长期记忆(记忆模式与记忆型代理构建)
- 章节 6:部署(部署概念与实践、连接部署和助手)
GitHub: https://github.com/langchain-ai/langgraph-101
并提供了完整的环境搭建指南和 Azure OpenAI 集成方案,课程涉及到的案例代码均已开源,让我们能快速上手实践。
分享 GitHub 上一份精心收集整理的编程面试题集合:Coding Interview Patterns。
按照解题模式分类整理,涵盖 28 种核心算法模式,包括双指针、滑动窗口、树搜索、图算法等,每个模式都附有对应的 LeetCode 练习链接。
GitHub: https://github.com/dipjul/Grokking-the-Coding-Interview-Patterns-for-Coding-Questions
主要特性:
- 按解题模式系统化分类,便于快速掌握核心算法思想
- 涵盖从简单到困难的多种难度题目,循序渐进
- 每种模式都提供详细介绍和多个练习题
- 包含各大科技公司常见面试题及其变形
- 提供完整的 LeetCode、GeeksforGeeks 等平台的题目链接
特别适合正准备技术面试的程序员,帮助我们系统学习算法,提高解题效率。
推荐 GitHub 上一款原生 macOS 的 AI 图像超分辨率工具:HiPixel。
基于 Upscayl 开发,提供更高效更实用图像放大功能,专注于工作流效率和 macOS 原生体验。
GitHub: https://github.com/okooo5km/hipixel
主要功能:
- 原生 macOS 应用程序,使用 SwiftUI 界面
- 高质量 AI 图像放大,支持多种图像格式
- 拖放自动处理,支持批量处理多张图片
- GPU 加速处理,速度快
- 支持 URL Scheme,便于第三方应用集成和自动化工作流
提供了安装包,可通过 GitHub 发布页面下载,操作简单直观。
微信公众号「GitHubDaily」
微博自动同步bot,原则上不搬运广告内容呢,如果自动搬运了广告内容麻烦帮忙点一下举报