这里推荐一个本地微调大模型的框架。
ZO2,一个仅用18G显存就能全参微调175B大模型的框架(当然也支持微调小一些的模型)。
更新:现在ZO2支持Qwen3啦,全参微调32B的版本只需要6GB显存。
Code: ***s://github***/liangyuwang/zo2 Paper: ***s://arxiv.org/abs/2503.12668。
上一篇 : 为什么《歌手》不请周杰伦、陈奕迅、王菲、张学友、孙燕姿、梁静茹、王力宏、林俊杰当节目嘉宾?
下一篇 : 如何看待苹果在 WWDC25 发布的 Foundation 模型框架,它将为开发者和用户带来哪些改变?








