qlora
-
QLoRa:在消费级GPU上微调大型语言模型
大多数大型语言模型(LLM)都无法在消费者硬件上进行微调。例如,650亿个参数模型需要超过780 Gb的GPU内存。这相当于10个A100 80gb的gpu。就算我们使用云服务器,…
-
QLoRa:利用GPU微调大型语言模型
点击参加51CTO网站内容调查问卷 译者 | 崔皓 审校 | 重楼 摘要 文章介绍了QLoRa(Quantized LLMs with Low-Rank Adapters),一种在…