模型
-
到底什么样的网络,才能带得动AIGC?
2023年,是AI人工智能技术全面爆红的一年。 以ChatGPT、GPT-4、文心一言为代表的AIGC大模型,集文本撰写、代码开发、诗词创作等功能于一体,展现出了超强的内容生产能…
-
全面了解大语言模型,这有一份阅读清单
大型语言模型已经引起了公众的注意,短短五年内,Transforme等模型几乎完全改变了自然语言处理领域。此外,它们还开始在计算机视觉和计算生物学等领域引发革命。 鉴于Transfo…
-
将入学考试题搬进中文大模型数据集,20477道题目,还带4个候选答案
随着中文大规模语言模型在自然语言理解与自然语言生成方面展现出强大的性能,现有针对特定自然语言处理任务的中文评测基准数据集已经不足以对中文大模型进行有效地评估。传统的中文评测基准主要…
-
Java 程序员从零开始学 LangChain —模型组件
前面的文章了不起给大家介绍了 LangChain 的一些基本知识,没看过的小伙伴可以点击这里去看下,今天了不起给大家介绍一下 LangChain 的第一个很重要…
-
大模型商业的搅局者?除了谷歌和微软,你可能忘记了它!
大模型的商业大戏愈发精彩了,这边是谷歌和 OpenAI 剑拔弩张军备竞赛,那边是各路豪强的大模型应用雪花般的涌来,你方唱罢我登场。 而在这串作为大模型先行者而出现的公司以及研究院的…
-
调LLaMA类模型没那么难,LoRA将模型微调缩减到几小时
最近几个月,ChatGPT 等一系列大语言模型(LLM)相继出现,随之而来的是算力紧缺日益严重。虽然人人都想打造专属于自己的大模型,但是能负担得起上亿参数模型训练的机构却寥寥无几。…
-
飞桨面向异构场景下的自动并行设计与实践
一、背景介绍 在介绍自动并行之前,我们思考一下为什么需要自动并行?一方面现在有着不同的模型结构,另一方面还有各种各样的并行策略,两者之间一般是多对多的映射关系。假设我们能实现一个统…
-
人工智能与巅峰表现
心流是一种高度专注和提高生产力的状态,常见于运动员、艺术家和知识工作者。 虽然GPT模型是一种人工智能语言模型,不能像人类一样体验心流,但其可以以一种产生高度集中和创造性输出的方式…
-
十行代码媲美RLHF,用社交游戏数据训练社会对齐模型
让语言模型的行为符合人类社会价值观是当前语言模型开发的重要环节。相应的训练也被称为价值对齐 (value alignment)。 当前主流的方案是 ChatGPT 所采用的 RLH…
-
清华朱军团队开源首个基于Transformer的多模态扩散大模型,文图互生、改写全拿下
据悉 GPT-4 将于本周发布,多模态将成为其一大亮点。当前的大语言模型正在成为理解各种模态的通用接口,能够根据不同模态信息来给出回复文本,但大语言模型生成的内容也仅仅局限于文本。…
-
未来已来:数据如何驱动AI大模型的竞争
随着人工智能的迅猛发展,高质量数据的重要性已愈发明显。以大型语言模型为例,近年来的飞跃式进展在很大程度上依赖于高质量和丰富的训练数据集。相比于GPT-2,GPT-3在模型架构上的改…
-
Meta 开源多感官人工智能模型,整合文本、音频、视觉等六类数据
Meta 公司发布了一个新的开源人工智能模型 ImageBind,该模型能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。该模型目前只是一个研究项目,还没有直…