Follow

教你从零开始构建类似 ChatGPT 的大语言模型。

在 GitHub 上发现一本《Build a Large Language Model (From Scratch)》书籍。

作者将带你从头开始构建一个类似 GPT 语言模型,这过程让你了解如何创建、训练和微调大型语言模型 (LLMs)!

在线阅读:livebook.manning.com/book/build-a-large-language-model-from-scratch/welcome/v-3/

涉及源码:github.com/rasbt/LLMs-from-scratch

书籍主要分为 8 大章节,如下:

第 1 章:了解大语言模型(LLM)解析

第 2 章:介绍文本数据处理技巧

第 3 章:通过编程实现注意力机制(Attention Mechanisms)

第 4 章:从零开始实现类似 GPT 模型

第 5 章:对未标注数据进行预训练

第 6 章:针对文本分类的模型微调

第 7 章:结合人类反馈进行模型微调

第 8 章:在实践中使用大语言模型

书籍前两章内容已出,剩下的会逐步放出。

:icon_weibo: weibo.com/5722964389/NEbXf8R0H

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。