MiniMind 🚀🚀 「大模型」2小时完全从0训练26M的小参数GPT!🌏 Train a 26M-parameter GPT from scratch in just 2h!

https://github.com/jingyaogong/minimind


我最近在学习大模型底层原理,为了实践上手,对该项目代码进行注释理解,以及尝试运行。

下面放一些导出的思源笔记pdf

Last modification:April 16, 2025
如果觉得我的文章对你有用,请随意赞赏