Show newer

微软在 GitHub 开源的一款 Python 工具:MarkItDown。

可用于将文件和办公文档,快速转换为 Markdown 格式,使内容更加易于维护与编辑。

GitHub: github.com/microsoft/markitdow

主要支持 PDF、Word、Excel、PPT、HTML、图像音频等多种格式,使用便捷。

:icon_weibo: weibo.com/5722964389/Pf8dtllv7

麻省理工出版社出品的一本的 AI 书籍:《深入了解机器学习》。

无论是对于初学者,还是有一定开发经验的人群,该书都有着极大的阅读价值。

书中覆盖深度学习的诸多知识点,如监督学习、卷积网络、图像生成、扩散模型、图神经网络等。

地址: udlbook.github.io/udlbook/

另外,里面还包含了不少 Python 笔记,可帮助学生通过编程的方式,进一步巩固基础知识。

:icon_weibo: weibo.com/5722964389/Pf7qM2jS6

GitHub 上一款强大的本地网页版 PDF 文件处理工具:Stirling-PDF,可 Docker 部署。

提供了丰富的 PDF 文件操作功能,包括拆分、合并、格式转换、内容排列、添加图片、旋转、压缩等。

GitHub: github.com/Frooodle/Stirling-P

其安全私密性非常高,所有文件和 PDF 操作都是在客户端进行,或者仅在服务器内存中临时处理,任务完成后即刻删除。

一旦用户下载了文件,该文件就会从服务器上删除。

:icon_weibo: weibo.com/5722964389/Pf4hW0C1V

Ollama-Scan,一个基于 Ollama 的命令行工具,提供友好的交互式界面来管理和使用 Ollama 模型。

GitHub: github.com/b3nguang/Ollama-Sca

主要功能特性如下:

📃 列出所有可用的模型

📥 拉取新的模型

🔍 查看模型详细信息

💬 与模型进行对话

⚡️ 查看运行中的模型进程

🎨 美观的命令行界面(使用 Rich 库)

🔄 交互式命令补全

:icon_weibo: weibo.com/5722964389/Pf3verW6g

GitHub 上一份开源的技术学习资料:build-your-own-x,自己动手,丰衣足食。

该库收集了诸多优质资源,教你如何构建一些属于自己的东西,内容主要分为人工智能、增强现实、机器人、编辑器、命令行工具、神经网络、操作系统等几大类别。

GitHub: github.com/codecrafters-io/bui

:icon_weibo: weibo.com/5722964389/Pf2Iw3A5Z

一份精心收集整理的优秀 AI 助手列表:Awesome assistants。

这里收集了各种各样类型的 AI 助手,比如营销助理、赚钱助手、代码助手、英语家教、Excel 助手等等。

GitHub: github.com/awesome-assistants/

收集的列表提供了 json、csv、tsv、html 文件格式,方便你集成使用。

:icon_weibo: weibo.com/5722964389/Pf1VOerxX

一个可帮你在家快速搭建 AI 集群的开源项目:exo。

该项目支持将现有设备统一到一个功能强大的GPU中,支持 iPhone,iPad,Android,Mac,Nvidia,树莓派等等几乎所有设备。

GitHub: github.com/exo-explore/exo

在项目部署成功后,一旦有新设备联网,即可接入使用,充当 AI 算力集群的一部分。

:icon_weibo: weibo.com/5722964389/Pf196szGG

一个带 Web 界面简单易用的 AI 声音克隆工具。

可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。

GitHub: github.com/jianchang512/clone-

支持中、英、日、韩、法、德、意等 16 种语言,另外还可以在线从麦克风录制声音。

使用非常简单,提供 exe 整合包,开箱即用。

:icon_weibo: weibo.com/5722964389/Pf0morjn1

近日,随之 DeepSeek V3/ R1 火爆全网,基于原始模型的解决方案和 API 服务已随处可见,陷入低价和免费内卷。

为了帮助更多开发者,以低成本打造高质量私有模型,提升业务竞争力与价值。

GitHub 上知名开源项目 Colossal-AI 通过后训练(post-training)结合专业领域数据,正式发布了「开源大模型后训练工具箱」!

GitHub: github.com/hpcaitech/ColossalA

该工具箱包括以下内容:

- DeepSeek V3/ R1 满血 671B LoRA 低成本 SFT 微调;

- 完整的强化学习工具链 PPO,GRPO,DPO,SimPO 等;

- 无缝适配 DeepSeek 系列蒸馏模型在内的 HuggingFace 开源模型;

- 兼容支持英伟达 GPU、华为昇腾 NPU 等多种硬件;

- 支持混合精度训练,gradient checkpoint 等训练加速降低成本;

- 灵活的训练配置接口,支持自定义奖励函数、损失函数等;

- 提供灵活的并行策略配置接口,包括数据并行、模型并行、专家并行、ZeRO 和 Offload 等,以适应不同硬件规模。

DeepSeek V3/R1 满血版参数高达 6710 亿,通过该项目,开发者仅需简单几步,即可快速实现低成本微调。

目前,该方案已在 GitHub 正式开源,感兴趣的同学可以深入了解,学习一下。

:icon_weibo: weibo.com/5722964389/PeZzGjsY9

GitHub 上一个开源的音频、音乐和语音生成整合工具包:Amphion。

支持如下功能:

- 文本转语音(TTS):高性能,支持主流模型及架构,可生成自然的声音。

- 歌声转换(SVC):可将某人歌声转换成其他人歌声,内置张学友、陈奕迅、王菲等已训练好的声音。

- 文本转音频(TTA):可通过文本提示,生成逼真的声效、语音以及音乐,类似于 AudioLDM。

GitHub: github.com/open-mmlab/Amphion

:icon_weibo: weibo.com/5722964389/PeYMYuiUN

推荐 GitHub 上开源免费一键生成短视频的 AI 工具 MoneyPrinterTurbo。

只需提供一个视频 主题 或 关键词,就可以全自动生成视频的文案、素材、字幕以及背景音乐,然后合成高清的短视频。

项目是基于 MoneyPrinter 重构而来,进行了大量的优化,支持中文并提供易于使用的 Web 界面。

GitHub: github.com/harry0703/MoneyPrin

功能特性:

- 完整的 MVC 架构,代码 结构清晰,易于维护,支持 API 和 Web 界面。

- 支持视频文案 AI 自动生成,也可以自定义文案。

- 支持多种 高清视频 尺寸,常见的 9:16、16:9。

- 支持 批量视频生成,可以一次生成多个视频,然后选择一个最满意的。

- 支持 视频片段时长设置,方便调节素材切换频率。

- 支持 中文 和 英文 视频文案。

- 支持 多种语音 合成。

- 支持 字幕生成,可以调整 字体、位置、颜色、大小,同时支持字幕描边设置。

- 支持 背景音乐,随机或者指定音乐文件,可设置背景音乐音量。

- 视频素材来源 高清,而且 无版权。

- 支持 OpenAI、moonshot、Azure、gpt4free、one-api 等多种模型接入。

:icon_weibo: weibo.com/5722964389/PeY0grWQO

GitHub 上一个开源图标库:Lucide,提供 1000 多个 SVG 文件。

该库旨在让设计人员和开发人员,更加简单便捷的将图标集成到项目中。

GitHub: github.com/lucide-icons/lucide

项目具备以下特点:

- 图标简洁,拥有可扩展的矢量图形(SVG);

- 严格的设计规则,以保持风格和可读性的一致性;

- 支持自定义颜色,尺寸,宽度大小等属性。

:icon_weibo: weibo.com/5722964389/PeXdyxhwo

hummingbot:一个可帮助你创建和部署高频加密交易机器人的开源软件。

该项目是一个开源框架,可帮助你设计和部署自动交易策略或机器人,在许多集中或分散的交易所上运行。

GitHub: github.com/hummingbot/hummingb

据团队介绍,过去一年,Hummingbot 用户在 140 多个独特的交易场所中,产生了超过 340 亿美元的交易量。

:icon_weibo: weibo.com/5722964389/PeUt676Vo

GitHub 上较火的一个 AI 项目:MiniMind。

此开源项目旨在完全从 0 开始,仅用 3 块钱成本 + 2小时,即可训练出仅为 25.8M 的超小语言模型MiniMind。

GitHub: https:// 网页链接

模型系列极其轻量,最小版本体积是 GPT-3 的 1/7000,力求做到最普通的个人GPU也可快速训练。

项目同时开源了大模型的极简结构-包含拓展共享混合专家(MoE)、数据集清洗、预训练(Pretrain)、监督微调(SFT)、LoRA微调, 直接偏好强化学习(DPO)算法、模型蒸馏算法等全过程代码。

MiniMind 同时拓展了视觉多模态的 VLM: MiniMind-V。

项目所有核心算法代码均从 0 使用 PyTorch 原生重构!不依赖第三方库提供的抽象接口。

这不仅是大语言模型的全阶段开源复现,也是一个入门 LLM 的教程。

:icon_weibo: weibo.com/5722964389/PeTGnaqeh

Google 开源的一个数据库生成式 AI 工具箱:Gen AI Toolbox for Databases。

在构建与数据库进行交互的生成式 AI 工具时,会更加高效简单。通过这款工具,令开发者可更加快速、安全地处理连接池,身份验证等复杂性任务。

GitHub: github.com/googleapis/genai-to

项目中内置有详尽的技术文档,可帮助你更快入门。

:icon_weibo: weibo.com/5722964389/PeRXndJNl

分享 GitHub 上一本开源的书籍:《Hands-On Large Language Models》。

中文名为《动手学大模型》,共 12 章节,涵盖了语言模型介绍、文本分类、提示词工程、语义搜索、微调模型、多模态模型等等从基础到高级的内容。

GitHub: github.com/HandsOnLLM/Hands-On

同时,书籍中通过大量代码示例,可直接在 Colab 运行,帮助我们更好地理解和应用大语言模型。

:icon_weibo: weibo.com/5722964389/PeQ9bCkdE

分享 GitHub 上一款实用的 Mac 电脑小工具:Mos。

它能够让我们的鼠标滚动效果如 Mac 电脑上的触摸板一样丝滑,可以说是用鼠标党必装的一款小工具。

GitHub: github.com/Caldis/Mos

项目自 2022 年停更之后,突然发现上个月作者恢复了更新,并发布最新版本 3.5.0。

第一时间安装,非常好用,建议没用过的可以试试。

:icon_weibo: weibo.com/5722964389/PeOzM4PUa

在 X 上另一个博主总结出的 8 条使用 AI 编程指南也颇为不错。

这些都是博主在使用众多 AI 编程工具,所总结出来的经验,可比许多收费教程都要好。

已为大家翻译成中文,希望对大家有所帮助。



1. 合理选择开发工具:不同的 AI 编程工具有其各自的专长。对于复杂应用推荐使用 Cursor/Windsurf,轻量级应用开发选择 Bolt/Lovable,移动应用开发使用 Replit,UI 设计则可以使用 v0。




2. 完善项目上下文:要以 .md 文档形式详细说明项目信息,包括:产品需求文档(PRD)、技术栈说明、文件结构、前端开发规范和后端架构设计。这样能有效防止 AI 生成偏离预期的内容。推荐使用 CodeGuide 编写 AI 开发文档,它与各类 AI 工具都能良好配合。




3. 拆分任务逐步实现:不要期望 AI 能一次性完成 “构建一个 AirBNB 克隆版“ 这样的大型任务。应该将项目分解为页面级任务,再把每个页面细分为组件级任务。记住 AI 一次最多能处理 3 个小任务。




4. 选择适合 AI 的技术栈:Claude Sonnet 3.5、GPT-4o、o3 和 o1 等 AI 模型在处理 React 和 Python 框架时表现出色。因此建议网页应用选用 NextJS、viteJS 和 Python,移动应用则使用 React Native(如果使用 Claude,SwiftUI 也是不错的选择)。




5. 善用项目模板:不要每次都从零开始,这样会浪费时间和资源。使用现成的项目模板(如 CodeGuide NextJS Starter Kit)可以快速搭建开发环境,提高效率。




6. 设定 AI 使用规范:通过规则文件来约束 AI 的行为,确保其遵循项目规范。可以创建 .cursorrules(项目规则)和 .windsurfrules 等文件来设定全局 AI 规则。




7. 组合多种工具优势:目前没有单一工具能完全满足 AI 开发的所有需求。建议使用 Perplexity 做研究,ChatGPT 语音做头脑风暴,CodeGuide 写文档,Firecrawl 做数据爬取,再配合其他 AI 编程工具来构建代码库。




8. 保持耐心和平和心态:与 AI 协作就像与 “外星智慧“ 沟通,需要学习理解 AI 的语言(提示词工程)。虽然 AI 可能会出错或产生偏差,但保持耐心和专注,慢慢引导它按照你的意图工作。


原帖:x.com/cj_zZZz/status/1890078645089346038

:icon_weibo: weibo.com/5722964389/PeKfT4Unf

跟大家分享一个收集了 50万+ SVG 图标的网站:svgrepo。

基本覆盖了所有类型的图标,并且按照颜色和样式进行分类,同时支持搜索,快速找到所需图标。

地址: https:// 网页链接

此外,这上面的图标均可免费下载并且可用于商业,值得收藏。

:icon_weibo: weibo.com/5722964389/PeJVNg3fd

推荐 GitHub 上一款快速生成优质短视频的开源工具:AI YouTube Shorts Generator。

利用 AI,自动识别一段长视频有趣、精彩、吸引人的部分,并自动化剪辑生成几条短视频。

GitHub: github.com/SamurAIGPT/AI-Youtu

同时,会为视频添加配乐、生成标题以及描述,直接一键发布到视频平台即可。

用来自动化剪辑名人演讲视频颇为不错,感兴趣的同学可以看下。

:icon_weibo: weibo.com/5722964389/PeJvcpf7a

Show older
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。