此前分享过的一本开源书籍《动手学大模型》,从基础到高级通俗易懂地讲解了如何理解和应用大模型。
今天发现其 GitHub 仓库上更新补充了一些关于 LLM 视觉教程,帮助我们理解复杂 AI 概念的问题。
这系列教程保持以往书中的可视化风格,通过精美图解讲解 Transformer、Mamba 等高级概念,让抽象理论变得超直观。
GitHub: https://github.com/HandsOnLLM/Hands-On-Large-Language-Models/tree/main/bonus
包括如下主要内容:
- 通过视觉化图解深入讲解 Transformer LLM 工作原理;
- 直观解释模型量化技术,理解如何高效部署大模型;
- 图解 Mamba 和状态空间模型的创新设计与优势;
- 讲解专家混合系统(MoE)如何实现更大规模模型;
- 可视化解析 Stable Diffusion 图像生成技术原理;
- 深入剖析 DeepSeek-R1 和 LLM 推理能力与 Agent 系统。
在开始这份教程学习之前,建议大家先看完《动手学模型》这本书籍后再来看这里的补充。