MiniMind 🚀🚀 「大模型」2小时完全从0训练26M的小参数GPT!🌏 Train a 26M-parameter GPT from scratch in just 2h!
https://github.com/jingyaogong/minimind
我最近在学习大模型底层原理,为了实践上手,对该项目代码进行注释理解,以及尝试运行。
下面放一些导出的思源笔记pdf
MiniMind 🚀🚀 「大模型」2小时完全从0训练26M的小参数GPT!🌏 Train a 26M-parameter GPT from scratch in just 2h!
https://github.com/jingyaogong/minimind
我最近在学习大模型底层原理,为了实践上手,对该项目代码进行注释理解,以及尝试运行。
下面放一些导出的思源笔记pdf