RWKV torch√ √ √ √ 预先量化和在线量化 默认参数在6G显存设备上运行良好。最新版懒人版已集成一键更新功能,建议使用前更新。 使用步骤(以glm6b模型为例): 下载懒人版主体和模型,模型可以用内置脚本从HF下载,也可以从网盘下载。 如果没有安装CUDA11.8 ...