模型

人工智能

GPT-4使用混合大模型？研究证明MoE+指令调优确实让大模型性能超群

自 GPT-4 问世以来，人们一直惊艳于它强大的涌现能力，包括出色的语言理解能力、生成能力、逻辑推理能力等等。这些能力让 GPT-4 成为机器学习领域最前沿的模型之一。然而，Ope…

8260
2023年7月18日
000
人工智能

给大语言模型“开个眼”，看图说话性能超CLIP！斯坦福等新方法无需多模态预训练

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。不靠多模态数据，大语言模型也能看得懂图？！话不多说，直接看效果。就拿曾测试过BLIP-2的长城照片…

6000
2023年7月18日
000
人工智能

ChatGPT上下文碾压64K开源模型！UC伯克利：开源模型能力严重「虚标」｜最新硬核评测曝光

早先发布Vicuna模型和大语言模型排位赛的LMSYS Org（UC伯克利主导）的研究人员又开始搞事情了。这次，他们开发出了一个支持长上下文的开源大模型家族LongChat-7B…

idachui
2023年7月18日
000
人工智能

只有GPT-4可以自我改进，GPT-3.5都不行，MIT&微软代码生成实验新发现

大型语言模型（LLM）已被证明能够从自然语言中生成代码片段，但在应对复杂的编码挑战，如专业竞赛和软件工程专业面试时，仍面临巨大的挑战。最近的研究试图通过利用自修复来提高模型编码性能…

晚风
2023年7月18日
000
人工智能

MIT华人博士共同一作：用概率程序建模，破解世界模型！

语言如何影响思维？人类如何从语言中获取意义？这两个基本问题是我们构建类人智能的关键。长久以来，理想中的AI，一直是通往人类水平的AI，为此业界大牛Yann LeCun还曾提出了…

5657
2023年7月18日
000
人工智能

GPT-4发布后，其他大模型怎么办？Yann LeCun：增强语言模型或许是条路

ChatGPT、GPT-4 的火爆，让大型语言模型迎来了迄今为止的高光时刻。但下一步又该往何处去？ Yann LeCun 最近参与的一项研究指出，增强语言模型或许是个极具潜力的方向…

莉莉安
2023年7月17日
000
人工智能

连GPT-4都考不及格，17个大模型悉数落败，因果推理太难了

自 ChatGPT 发布以来，大模型的涌现能力一直被人们称赞，包括强大的语言理解能力、生成能力、逻辑推理能力等。然而，最近一项研究表明，大模型在因果推理方面普遍性能很差，连 GPT…

0560
2023年7月17日
000
人工智能

通过一组单词构建视觉语言模型可能性研究

译者 | 朱先忠审校 | 重楼当前，多模式人工智能已经成为一个街谈巷议的热门话题。随着GPT-4的最近发布，我们看到了无数可能出现的新应用和未来技术，而这在六个月前是不可想…

7762
2023年7月17日
000
人工智能

OpenAI 开发新工具，试图解释语言模型的行为

5 月 10 日消息，语言模型是一种人工智能技术，可以根据给定的文本生成自然语言。OpenAI 的 GPT 系列语言模型是目前最先进的代表之一，但IT之家注意到它们也有一个问题：它…

psdoc
2023年7月17日
000
人工智能

模块化MoE将成为视觉多任务学习基础模型

多任务学习（MTL）存在很多挑战，因为不同任务之间的梯度可能矛盾。为了利用任务之间的关联，作者引入了 Mod-Squad 模型，它是多个专家组成的模块化模型。模型可以灵活优化任务和…

9551
2023年7月17日
000
人工智能

英特尔研究院发布全新 AI 扩散模型，可根据文本提示生成 360 度全景图

6 月 21 日消息，英特尔研究院今日宣布与 Blockade Labs 合作发布 LDM3D（Latent Diffusion Model for 3D）模型，这一全新的扩散模型…

0008
2023年7月17日
000
人工智能

新加坡国立大学发布 AI 算数模型 GOAT，能力居于 GPT-4 之上

6 月 7 日消息，当下 GPT-4 模型最大的短板主要是算术能力，由于模型的逻辑推理能力尚待提升，因此即使是许多人认为相对简单的计算问题，GPT-4 却无法得出正确的结果。近日…

4528
2023年7月17日
000

4 / 45
1
2
3
4
5
6