llm
-
GPT充当大脑,指挥多个模型协作完成各类任务,通用系统AutoML-GPT来了
当前,AI 模型虽然已经涉及非常广泛的应用领域,但大部分 AI 模型是为特定任务而设计的,它们往往需要大量的人力来完成正确的模型架构、优化算法和超参数。ChatGPT、GPT-4 …
-
马腾宇团队新出大模型预训练优化器,比Adam快2倍,成本减半
鉴于语言模型预训练成本巨大,因而研究者一直在寻找减少训练时间和成本的新方向。Adam 及其变体多年来一直被奉为最先进的优化器,但其会产生过多的开销。本文提出了一种简单的可扩展的二阶…
-
280万条多模态指令-响应对,八种语言通用,首个涵盖视频内容的指令数据集MIMIC-IT来了
近段时间来,AI 对话助手在语言任务上取得了不小的进展。这种显著的进步不只是基于 LLM 强大的泛化能力,还应该归功于指令调优。这涉及到在一系列通过多样化和高质量指令的任务上对 L…
-
LLM推理提速2.8倍,CMU清华姚班校友提出「投机式推理」引擎SpecInfer,小模型撬动大模型高效推理
随着 ChatGPT 的出现,大规模语言模型(LLM)研究及其应用得到学术界和工业界的广泛关注。一方面,开源的 LLM 模型不断涌现,比如 OPT、BLOOM、LLaMA 等,这些…
-
训练时间减少71.4%,存储成本节省99.9%,厦大指令调优新方案MMA让羊驼模型实现多模态
MMA 不使用大型神经网络来连接图像编码器和 LLM,而是采用轻量级模块,即适配器,来弥合 LLMs 和 VL 任务之间的差距,同时也实现了图像模型和语言模型的联合优化。同时,MM…
-
模仿Jeff Dean神总结,前谷歌工程师分享「LLM开发秘籍」:每个开发者都应知道的数字!
最近,一位网友整理了一份「每个LLM开发者都应该知道的数字」,同时解释了这些数字为何重要,以及我们应该如何利用它们。 他在谷歌的时候,就有一份由传奇工程师Jeff Dean整理的文…
-
训练成本不到1000元,直降90%!NUS、清华发布VPGTrans:轻松定制类GPT-4多模态大模型
今年是AI技术爆发式发展的一年,以ChatGPT为代表的大语言模型(LLM)大火。 语言模型除了在自然语言领域显示出巨大的潜力之外,也开始逐渐辐射到其他模态,比如文生图模型Stab…
-
多个ChatGPT合作完成指定任务,迷你AGI控制世界要来了?
未来的社会会被通用人工智能(AGI)控制吗?当拥有多个 ChatGPT 智能体会有多可怕。 ChatGPT 已经初步展现了 AGI 的雏形,成为了各行各业工作人员的全能小助手,但如…
-
如何通过提示工程训练您的聊天机器人?
译者 | 布加迪 审校 | 重楼 近几个月来基于人工智能(AI)的聊天机器人风靡全球,一个原因是它们可以为各种用途生成或完善文本,无论策划广告活动还是撰写简历。 这些聊天机器人基于…
-
LLM之战,谷歌输了!越来越多顶尖研究员跳槽OpenAI
前几天,谷歌差点遭遇一场公关危机,Bert一作、已跳槽OpenAI的前员工Jacob Devlin曝出,Bard竟是用ChatGPT的数据训练的。 随后,谷歌火速否认。 而这场争…
-
能听懂语音的ChatGPT来了:10小时录音扔进去,想问什么问什么
大型语言模型(LLM)正在改变每个行业的用户期望。然而,建立以人类语音为中心的生成式人工智能产品仍然很困难,因为音频文件对大型语言模型构成了挑战。 将 LLM 应用于音频文件的一个…
-
斯坦福最新LLM排行榜发布!自家Alpaca垫底,华人团队WizardLM开源第一,GPT-4、Claude稳居前二
前段时间,UC伯克利主导的「LLM排位赛」备受圈内关注。 除了各类开源模型外,还有GPT-4、PaLM 2等众多「闭源」模型,甚至还开设了一个「准中文」排行榜。 最近,来自斯坦福的…