Loading...
本文介绍了如何使用MiniMind项目在2小时内从零开始训练一个26M参数的小型GPT模型。作者通过注释代码、理解原理并实际运行,分享了学习大模型底层原理的实践心得。
在使用Python 3.12和Huggingface的Transformer库时,遇到“NameError: name 'init_empty_weigh...
Edge浏览器默认开启的“使用文本光标导航页面”功能,在特定情况下如使用slidev时会导致不便,关闭此设置可解决问题。
本文介绍了如何在本地部署Overleaf,包括克隆项目、配置文件修改、设置SMTP邮箱、调整容器名称以及启动服务的步骤。通过修改配置文件实现端口监听、镜像...
本文介绍了在Windows下使用VSCode配置SSH免密登录的方法,包括使用Powershell生成密钥、上传公钥至服务器,并展示了配置后的登录过程。