GitHub 上一款强大的本地网页版 PDF 文件处理工具:Stirling-PDF,可 Docker 部署。

提供了丰富的 PDF 文件操作功能,包括拆分、合并、格式转换、内容排列、添加图片、旋转、压缩等。

GitHub: github.com/Frooodle/Stirling-P

其安全私密性非常高,所有文件和 PDF 操作都是在客户端进行,或者仅在服务器内存中临时处理,任务完成后即刻删除。

一旦用户下载了文件,该文件就会从服务器上删除。

:icon_weibo: weibo.com/5722964389/Pf4hW0C1V

Ollama-Scan,一个基于 Ollama 的命令行工具,提供友好的交互式界面来管理和使用 Ollama 模型。

GitHub: github.com/b3nguang/Ollama-Sca

主要功能特性如下:

📃 列出所有可用的模型

📥 拉取新的模型

🔍 查看模型详细信息

💬 与模型进行对话

⚡️ 查看运行中的模型进程

🎨 美观的命令行界面(使用 Rich 库)

🔄 交互式命令补全

:icon_weibo: weibo.com/5722964389/Pf3verW6g

GitHub 上一份开源的技术学习资料:build-your-own-x,自己动手,丰衣足食。

该库收集了诸多优质资源,教你如何构建一些属于自己的东西,内容主要分为人工智能、增强现实、机器人、编辑器、命令行工具、神经网络、操作系统等几大类别。

GitHub: github.com/codecrafters-io/bui

:icon_weibo: weibo.com/5722964389/Pf2Iw3A5Z

一份精心收集整理的优秀 AI 助手列表:Awesome assistants。

这里收集了各种各样类型的 AI 助手,比如营销助理、赚钱助手、代码助手、英语家教、Excel 助手等等。

GitHub: github.com/awesome-assistants/

收集的列表提供了 json、csv、tsv、html 文件格式,方便你集成使用。

:icon_weibo: weibo.com/5722964389/Pf1VOerxX

一个可帮你在家快速搭建 AI 集群的开源项目:exo。

该项目支持将现有设备统一到一个功能强大的GPU中,支持 iPhone,iPad,Android,Mac,Nvidia,树莓派等等几乎所有设备。

GitHub: github.com/exo-explore/exo

在项目部署成功后,一旦有新设备联网,即可接入使用,充当 AI 算力集群的一部分。

:icon_weibo: weibo.com/5722964389/Pf196szGG

一个带 Web 界面简单易用的 AI 声音克隆工具。

可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。

GitHub: github.com/jianchang512/clone-

支持中、英、日、韩、法、德、意等 16 种语言,另外还可以在线从麦克风录制声音。

使用非常简单,提供 exe 整合包,开箱即用。

:icon_weibo: weibo.com/5722964389/Pf0morjn1

近日,随之 DeepSeek V3/ R1 火爆全网,基于原始模型的解决方案和 API 服务已随处可见,陷入低价和免费内卷。

为了帮助更多开发者,以低成本打造高质量私有模型,提升业务竞争力与价值。

GitHub 上知名开源项目 Colossal-AI 通过后训练(post-training)结合专业领域数据,正式发布了「开源大模型后训练工具箱」!

GitHub: github.com/hpcaitech/ColossalA

该工具箱包括以下内容:

- DeepSeek V3/ R1 满血 671B LoRA 低成本 SFT 微调;

- 完整的强化学习工具链 PPO,GRPO,DPO,SimPO 等;

- 无缝适配 DeepSeek 系列蒸馏模型在内的 HuggingFace 开源模型;

- 兼容支持英伟达 GPU、华为昇腾 NPU 等多种硬件;

- 支持混合精度训练,gradient checkpoint 等训练加速降低成本;

- 灵活的训练配置接口,支持自定义奖励函数、损失函数等;

- 提供灵活的并行策略配置接口,包括数据并行、模型并行、专家并行、ZeRO 和 Offload 等,以适应不同硬件规模。

DeepSeek V3/R1 满血版参数高达 6710 亿,通过该项目,开发者仅需简单几步,即可快速实现低成本微调。

目前,该方案已在 GitHub 正式开源,感兴趣的同学可以深入了解,学习一下。

:icon_weibo: weibo.com/5722964389/PeZzGjsY9

GitHub 上一个开源的音频、音乐和语音生成整合工具包:Amphion。

支持如下功能:

- 文本转语音(TTS):高性能,支持主流模型及架构,可生成自然的声音。

- 歌声转换(SVC):可将某人歌声转换成其他人歌声,内置张学友、陈奕迅、王菲等已训练好的声音。

- 文本转音频(TTA):可通过文本提示,生成逼真的声效、语音以及音乐,类似于 AudioLDM。

GitHub: github.com/open-mmlab/Amphion

:icon_weibo: weibo.com/5722964389/PeYMYuiUN

推荐 GitHub 上开源免费一键生成短视频的 AI 工具 MoneyPrinterTurbo。

只需提供一个视频 主题 或 关键词,就可以全自动生成视频的文案、素材、字幕以及背景音乐,然后合成高清的短视频。

项目是基于 MoneyPrinter 重构而来,进行了大量的优化,支持中文并提供易于使用的 Web 界面。

GitHub: github.com/harry0703/MoneyPrin

功能特性:

- 完整的 MVC 架构,代码 结构清晰,易于维护,支持 API 和 Web 界面。

- 支持视频文案 AI 自动生成,也可以自定义文案。

- 支持多种 高清视频 尺寸,常见的 9:16、16:9。

- 支持 批量视频生成,可以一次生成多个视频,然后选择一个最满意的。

- 支持 视频片段时长设置,方便调节素材切换频率。

- 支持 中文 和 英文 视频文案。

- 支持 多种语音 合成。

- 支持 字幕生成,可以调整 字体、位置、颜色、大小,同时支持字幕描边设置。

- 支持 背景音乐,随机或者指定音乐文件,可设置背景音乐音量。

- 视频素材来源 高清,而且 无版权。

- 支持 OpenAI、moonshot、Azure、gpt4free、one-api 等多种模型接入。

:icon_weibo: weibo.com/5722964389/PeY0grWQO

GitHub 上一个开源图标库:Lucide,提供 1000 多个 SVG 文件。

该库旨在让设计人员和开发人员,更加简单便捷的将图标集成到项目中。

GitHub: github.com/lucide-icons/lucide

项目具备以下特点:

- 图标简洁,拥有可扩展的矢量图形(SVG);

- 严格的设计规则,以保持风格和可读性的一致性;

- 支持自定义颜色,尺寸,宽度大小等属性。

:icon_weibo: weibo.com/5722964389/PeXdyxhwo

hummingbot:一个可帮助你创建和部署高频加密交易机器人的开源软件。

该项目是一个开源框架,可帮助你设计和部署自动交易策略或机器人,在许多集中或分散的交易所上运行。

GitHub: github.com/hummingbot/hummingb

据团队介绍,过去一年,Hummingbot 用户在 140 多个独特的交易场所中,产生了超过 340 亿美元的交易量。

:icon_weibo: weibo.com/5722964389/PeUt676Vo

GitHub 上较火的一个 AI 项目:MiniMind。

此开源项目旨在完全从 0 开始,仅用 3 块钱成本 + 2小时,即可训练出仅为 25.8M 的超小语言模型MiniMind。

GitHub: https:// 网页链接

模型系列极其轻量,最小版本体积是 GPT-3 的 1/7000,力求做到最普通的个人GPU也可快速训练。

项目同时开源了大模型的极简结构-包含拓展共享混合专家(MoE)、数据集清洗、预训练(Pretrain)、监督微调(SFT)、LoRA微调, 直接偏好强化学习(DPO)算法、模型蒸馏算法等全过程代码。

MiniMind 同时拓展了视觉多模态的 VLM: MiniMind-V。

项目所有核心算法代码均从 0 使用 PyTorch 原生重构!不依赖第三方库提供的抽象接口。

这不仅是大语言模型的全阶段开源复现,也是一个入门 LLM 的教程。

:icon_weibo: weibo.com/5722964389/PeTGnaqeh

Google 开源的一个数据库生成式 AI 工具箱:Gen AI Toolbox for Databases。

在构建与数据库进行交互的生成式 AI 工具时,会更加高效简单。通过这款工具,令开发者可更加快速、安全地处理连接池,身份验证等复杂性任务。

GitHub: github.com/googleapis/genai-to

项目中内置有详尽的技术文档,可帮助你更快入门。

:icon_weibo: weibo.com/5722964389/PeRXndJNl

分享 GitHub 上一本开源的书籍:《Hands-On Large Language Models》。

中文名为《动手学大模型》,共 12 章节,涵盖了语言模型介绍、文本分类、提示词工程、语义搜索、微调模型、多模态模型等等从基础到高级的内容。

GitHub: github.com/HandsOnLLM/Hands-On

同时,书籍中通过大量代码示例,可直接在 Colab 运行,帮助我们更好地理解和应用大语言模型。

:icon_weibo: weibo.com/5722964389/PeQ9bCkdE

分享 GitHub 上一款实用的 Mac 电脑小工具:Mos。

它能够让我们的鼠标滚动效果如 Mac 电脑上的触摸板一样丝滑,可以说是用鼠标党必装的一款小工具。

GitHub: github.com/Caldis/Mos

项目自 2022 年停更之后,突然发现上个月作者恢复了更新,并发布最新版本 3.5.0。

第一时间安装,非常好用,建议没用过的可以试试。

:icon_weibo: weibo.com/5722964389/PeOzM4PUa

在 X 上另一个博主总结出的 8 条使用 AI 编程指南也颇为不错。

这些都是博主在使用众多 AI 编程工具,所总结出来的经验,可比许多收费教程都要好。

已为大家翻译成中文,希望对大家有所帮助。



1. 合理选择开发工具:不同的 AI 编程工具有其各自的专长。对于复杂应用推荐使用 Cursor/Windsurf,轻量级应用开发选择 Bolt/Lovable,移动应用开发使用 Replit,UI 设计则可以使用 v0。




2. 完善项目上下文:要以 .md 文档形式详细说明项目信息,包括:产品需求文档(PRD)、技术栈说明、文件结构、前端开发规范和后端架构设计。这样能有效防止 AI 生成偏离预期的内容。推荐使用 CodeGuide 编写 AI 开发文档,它与各类 AI 工具都能良好配合。




3. 拆分任务逐步实现:不要期望 AI 能一次性完成 “构建一个 AirBNB 克隆版“ 这样的大型任务。应该将项目分解为页面级任务,再把每个页面细分为组件级任务。记住 AI 一次最多能处理 3 个小任务。




4. 选择适合 AI 的技术栈:Claude Sonnet 3.5、GPT-4o、o3 和 o1 等 AI 模型在处理 React 和 Python 框架时表现出色。因此建议网页应用选用 NextJS、viteJS 和 Python,移动应用则使用 React Native(如果使用 Claude,SwiftUI 也是不错的选择)。




5. 善用项目模板:不要每次都从零开始,这样会浪费时间和资源。使用现成的项目模板(如 CodeGuide NextJS Starter Kit)可以快速搭建开发环境,提高效率。




6. 设定 AI 使用规范:通过规则文件来约束 AI 的行为,确保其遵循项目规范。可以创建 .cursorrules(项目规则)和 .windsurfrules 等文件来设定全局 AI 规则。




7. 组合多种工具优势:目前没有单一工具能完全满足 AI 开发的所有需求。建议使用 Perplexity 做研究,ChatGPT 语音做头脑风暴,CodeGuide 写文档,Firecrawl 做数据爬取,再配合其他 AI 编程工具来构建代码库。




8. 保持耐心和平和心态:与 AI 协作就像与 “外星智慧“ 沟通,需要学习理解 AI 的语言(提示词工程)。虽然 AI 可能会出错或产生偏差,但保持耐心和专注,慢慢引导它按照你的意图工作。


原帖:x.com/cj_zZZz/status/1890078645089346038

:icon_weibo: weibo.com/5722964389/PeKfT4Unf

跟大家分享一个收集了 50万+ SVG 图标的网站:svgrepo。

基本覆盖了所有类型的图标,并且按照颜色和样式进行分类,同时支持搜索,快速找到所需图标。

地址: https:// 网页链接

此外,这上面的图标均可免费下载并且可用于商业,值得收藏。

:icon_weibo: weibo.com/5722964389/PeJVNg3fd

推荐 GitHub 上一款快速生成优质短视频的开源工具:AI YouTube Shorts Generator。

利用 AI,自动识别一段长视频有趣、精彩、吸引人的部分,并自动化剪辑生成几条短视频。

GitHub: github.com/SamurAIGPT/AI-Youtu

同时,会为视频添加配乐、生成标题以及描述,直接一键发布到视频平台即可。

用来自动化剪辑名人演讲视频颇为不错,感兴趣的同学可以看下。

:icon_weibo: weibo.com/5722964389/PeJvcpf7a

跟大家分享一下在 X 上发现的一条 10k+ 点赞的爆款帖子。

博主总结了其在使用 Cursor 编程的 15 条经验建议,让我们更好使用 Cursor 轻松开发。

已进行中文翻译,希望对大家有所帮助。



1. 从模板开始:通过从 GitHub 或其他来源克隆模板来开始项目,以提供坚实的基础。(在 Cursor 中,从 Repo 开始,并粘贴此链接以构建预置 AI 功能、数据库和授权的 nextjs 应用: 网页链接 )




2. 使用智能体模式:使用 Cursor 的智能体模式(而不是普通模式)来通过自然语言命令创建、编辑和管理文件。




3. 使用 Perplexity:使用 perplexity 从网络上查找新的设计和 API。说明你正在创建一个 nextjs 项目,并且你想要创建某个功能,让它为你提供说明和代码示例。




4. 在 Composer 中创建新对话:为每个不同的任务开启新的 Composer 对话,保持智能体对话简短。




5. 本地运行,频繁测试:使用内置服务器在本地运行应用并经常测试,以尽早发现问题。




6. 迭代和改进:拥抱快速迭代—初期不要过于追求完美设计,而是逐步改进。




7. 使用语音转文本:使用像 Whispr Flow 这样的工具来实现更快的输入,保持轻松。




8. 明智地克隆和分叉:使用 GitHub 仓库作为起始模板来加速开发或寻找灵感,然后根据你的愿景进行定制。




9. 将错误复制给智能体:当出现错误时,将控制台的错误信息复制并粘贴到 Composer 智能体中,大多数情况下都能得到解决。处理错误时,如果第一次没有解决,详细解释问题。




10. 记得可以恢复之前的对话:经常保存你的工作,以便在需要时可以恢复到之前的状态。




11. 保护你的密钥:始终将 API 密钥和敏感数据存储在环境文件中,而不是硬编码。




12. 经常提交:定期将进度推送到 GitHub 以跟踪更改和保护你的工作。Cursor 可以帮你完成这个,只需询问智能体。




13. 尽早部署:使用像 Vercel 这样的平台尽早部署你的应用,以确保部署时没有错误。




14. 记录并重用有效的提示语:记录最有效的提示,以便未来的开发和调试更容易。




15. 享受过程:拥抱轻松编程的创作之旅,大胆尝试,不断学习,享受其中的乐趣。保持轻松。


原贴:x.com/rileybrown_ai/status/1889832939216941100

:icon_weibo: weibo.com/5722964389/PeJ4OzEe0

微软出了一门给初学者学习的 AI 智能体课程:AI Agents for Beginners。

共 10 节课程,涵盖构建 AI 智能体的所有基础知识,旨在教授我们从零开始构建一个 AI 智能体。

GitHub: github.com/microsoft/ai-agents

课程内容已做了中文翻译,学习起来更加轻松,同时提供每节课所使用的示例代码,方便我们运行。

计划下个月,课程还会配套视频,值得我们关注学习。

:icon_weibo: weibo.com/5722964389/PeIIuso2C

Show older
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。