calm

教大模型自己跳过“无用”层，推理速度×3性能不变，谷歌MIT这个新方法火了

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。大语言模型用着爽，但推理速度实在太慢了？而且，增加模型体积，推理效果也并不一定就比之前更好。为了解…

TT7
2023年7月15日 • 人工智能
000