qlora

前端后端

QLoRa：在消费级GPU上微调大型语言模型

大多数大型语言模型(LLM)都无法在消费者硬件上进行微调。例如，650亿个参数模型需要超过780 Gb的GPU内存。这相当于10个A100 80gb的gpu。就算我们使用云服务器，…

9682
2023年7月15日
000
前端后端

QLoRa：利用GPU微调大型语言模型

点击参加51CTO网站内容调查问卷译者 | 崔皓审校 | 重楼摘要文章介绍了QLoRa（Quantized LLMs with Low-Rank Adapters），一种在…

6000
2023年7月15日
000