模型
-
GPT-4使用混合大模型?研究证明MoE+指令调优确实让大模型性能超群
自 GPT-4 问世以来,人们一直惊艳于它强大的涌现能力,包括出色的语言理解能力、生成能力、逻辑推理能力等等。这些能力让 GPT-4 成为机器学习领域最前沿的模型之一。然而,Ope…
-
给大语言模型“开个眼”,看图说话性能超CLIP!斯坦福等新方法无需多模态预训练
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 不靠多模态数据,大语言模型也能看得懂图?! 话不多说,直接看效果。 就拿曾测试过BLIP-2的长城照片…
-
ChatGPT上下文碾压64K开源模型!UC伯克利:开源模型能力严重「虚标」|最新硬核评测曝光
早先发布Vicuna模型和大语言模型排位赛的LMSYS Org(UC伯克利主导)的研究人员又开始搞事情了。 这次,他们开发出了一个支持长上下文的开源大模型家族LongChat-7B…
-
只有GPT-4可以自我改进,GPT-3.5都不行,MIT&微软代码生成实验新发现
大型语言模型(LLM)已被证明能够从自然语言中生成代码片段,但在应对复杂的编码挑战,如专业竞赛和软件工程专业面试时,仍面临巨大的挑战。最近的研究试图通过利用自修复来提高模型编码性能…
-
MIT华人博士共同一作:用概率程序建模,破解世界模型!
语言如何影响思维?人类如何从语言中获取意义? 这两个基本问题是我们构建类人智能的关键。 长久以来,理想中的AI,一直是通往人类水平的AI,为此业界大牛Yann LeCun还曾提出了…
-
GPT-4发布后,其他大模型怎么办?Yann LeCun:增强语言模型或许是条路
ChatGPT、GPT-4 的火爆,让大型语言模型迎来了迄今为止的高光时刻。但下一步又该往何处去? Yann LeCun 最近参与的一项研究指出,增强语言模型或许是个极具潜力的方向…
-
连GPT-4都考不及格,17个大模型悉数落败,因果推理太难了
自 ChatGPT 发布以来,大模型的涌现能力一直被人们称赞,包括强大的语言理解能力、生成能力、逻辑推理能力等。然而,最近一项研究表明,大模型在因果推理方面普遍性能很差,连 GPT…
-
通过一组单词构建视觉语言模型可能性研究
译者 | 朱先忠 审校 | 重楼 当前,多模式人工智能已经成为一个街谈巷议的热门话题。随着GPT-4的最近发布,我们看到了无数可能出现的新应用和未来技术,而这在六个月前是不可想…
-
OpenAI 开发新工具,试图解释语言模型的行为
5 月 10 日消息,语言模型是一种人工智能技术,可以根据给定的文本生成自然语言。OpenAI 的 GPT 系列语言模型是目前最先进的代表之一,但IT之家注意到它们也有一个问题:它…
-
模块化MoE将成为视觉多任务学习基础模型
多任务学习(MTL)存在很多挑战,因为不同任务之间的梯度可能矛盾。为了利用任务之间的关联,作者引入了 Mod-Squad 模型,它是多个专家组成的模块化模型。模型可以灵活优化任务和…
-
英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图
6 月 21 日消息,英特尔研究院今日宣布与 Blockade Labs 合作发布 LDM3D(Latent Diffusion Model for 3D)模型,这一全新的扩散模型…
-
新加坡国立大学发布 AI 算数模型 GOAT,能力居于 GPT-4 之上
6 月 7 日消息,当下 GPT-4 模型最大的短板主要是算术能力,由于模型的逻辑推理能力尚待提升,因此即使是许多人认为相对简单的计算问题,GPT-4 却无法得出正确的结果。 近日…