llm

GPT充当大脑，指挥多个模型协作完成各类任务，通用系统AutoML-GPT来了

当前，AI 模型虽然已经涉及非常广泛的应用领域，但大部分 AI 模型是为特定任务而设计的，它们往往需要大量的人力来完成正确的模型架构、优化算法和超参数。ChatGPT、GPT-4 …

2275
2023年7月17日 • 人工智能
000
马腾宇团队新出大模型预训练优化器，比Adam快2倍，成本减半

鉴于语言模型预训练成本巨大，因而研究者一直在寻找减少训练时间和成本的新方向。Adam 及其变体多年来一直被奉为最先进的优化器，但其会产生过多的开销。本文提出了一种简单的可扩展的二阶…

Z
2023年7月17日 • 人工智能
000
280万条多模态指令-响应对，八种语言通用，首个涵盖视频内容的指令数据集MIMIC-IT来了

近段时间来，AI 对话助手在语言任务上取得了不小的进展。这种显著的进步不只是基于 LLM 强大的泛化能力，还应该归功于指令调优。这涉及到在一系列通过多样化和高质量指令的任务上对 L…

7097
2023年7月17日 • 人工智能
000
LLM推理提速2.8倍，CMU清华姚班校友提出「投机式推理」引擎SpecInfer，小模型撬动大模型高效推理

随着 ChatGPT 的出现，大规模语言模型（LLM）研究及其应用得到学术界和工业界的广泛关注。一方面，开源的 LLM 模型不断涌现，比如 OPT、BLOOM、LLaMA 等，这些…

Lycoris
2023年7月17日 • 人工智能
000
训练时间减少71.4%，存储成本节省99.9%，厦大指令调优新方案MMA让羊驼模型实现多模态

MMA 不使用大型神经网络来连接图像编码器和 LLM，而是采用轻量级模块，即适配器，来弥合 LLMs 和 VL 任务之间的差距，同时也实现了图像模型和语言模型的联合优化。同时，MM…

0673
2023年7月17日 • 人工智能
000
模仿Jeff Dean神总结，前谷歌工程师分享「LLM开发秘籍」：每个开发者都应知道的数字！

最近，一位网友整理了一份「每个LLM开发者都应该知道的数字」，同时解释了这些数字为何重要，以及我们应该如何利用它们。他在谷歌的时候，就有一份由传奇工程师Jeff Dean整理的文…

5945
2023年7月17日 • 人工智能
000
训练成本不到1000元，直降90%！NUS、清华发布VPGTrans：轻松定制类GPT-4多模态大模型

今年是AI技术爆发式发展的一年，以ChatGPT为代表的大语言模型（LLM）大火。语言模型除了在自然语言领域显示出巨大的潜力之外，也开始逐渐辐射到其他模态，比如文生图模型Stab…

絕版尛豬ビ
2023年7月17日 • 人工智能
000
多个ChatGPT合作完成指定任务，迷你AGI控制世界要来了?

未来的社会会被通用人工智能（AGI）控制吗？当拥有多个 ChatGPT 智能体会有多可怕。 ChatGPT 已经初步展现了 AGI 的雏形，成为了各行各业工作人员的全能小助手，但如…

︶ㄣ东哥
2023年7月17日 • 人工智能
000
人工智能

如何通过提示工程训练您的聊天机器人？

译者 | 布加迪审校 | 重楼近几个月来基于人工智能（AI）的聊天机器人风靡全球，一个原因是它们可以为各种用途生成或完善文本，无论策划广告活动还是撰写简历。这些聊天机器人基于…

5055
2023年7月17日
000
LLM之战，谷歌输了！越来越多顶尖研究员跳槽OpenAI

前几天，谷歌差点遭遇一场公关危机，Bert一作、已跳槽OpenAI的前员工Jacob Devlin曝出，Bard竟是用ChatGPT的数据训练的。随后，谷歌火速否认。而这场争…

蒲公英飞走了
2023年7月17日 • 人工智能
000
能听懂语音的ChatGPT来了：10小时录音扔进去，想问什么问什么

大型语言模型（LLM）正在改变每个行业的用户期望。然而，建立以人类语音为中心的生成式人工智能产品仍然很困难，因为音频文件对大型语言模型构成了挑战。将 LLM 应用于音频文件的一个…

yinjianhua
2023年7月17日 • 人工智能
000
斯坦福最新LLM排行榜发布！自家Alpaca垫底，华人团队WizardLM开源第一，GPT-4、Claude稳居前二

前段时间，UC伯克利主导的「LLM排位赛」备受圈内关注。除了各类开源模型外，还有GPT-4、PaLM 2等众多「闭源」模型，甚至还开设了一个「准中文」排行榜。最近，来自斯坦福的…

qiuyue2525
2023年7月17日 • 人工智能
000

2 / 6
1
2
3
4
5
6