Loading...
本文介绍了如何使用MiniMind项目在2小时内从零开始训练一个26M参数的小型GPT模型。作者通过注释代码、理解原理并实际运行,分享了学习大模型底层原理的实践心得。
在使用Python 3.12和Huggingface的Transformer库时,遇到“NameError: name 'init_empty_weigh...
Edge浏览器默认开启的“使用文本光标导航页面”功能,在特定情况下如使用slidev时会导致不便,关闭此设置可解决问题。
本文介绍了部署Overleaf本地版的方法,包括克隆项目、进入目录、初始化配置、获取配置文件、启动Docker构建脚本,并介绍了如何访问和设置管理员账号密码。
本文介绍了在Windows下使用VSCode配置SSH免密登录的方法,包括使用Powershell生成密钥、上传公钥至服务器,并展示了配置后的登录过程。