模型
-
FudanNLP团队最新成果,借助RLHF实现人类对齐的MOSS-RLHF来了
以 ChatGPT 为代表的大型语言模型(LLM)在各项任务上的高效表现彰显了其广阔发展前景。然而,大模型回复与人类价值偏好经常存在不一致问题。 如何让大模型更好的与人类价值观对齐…
-
大模型时代,解析周志华教授的「学件」思想:小模型也可做大事
毫无疑问,我们正在进入一个大模型时代,各种开源或闭源的大模型不断涌现,解决一个又一个的应用,填补一个又一个的空白。而在此之前已经有了许多「足够好的」小模型。于是对于用户来说,要找到…
-
终极「揭秘」:GPT-4模型架构、训练成本、数据集信息都被扒出来了
一直以来,大家都对 GPT-4 的模型架构、基础设施、训练数据集、成本等信息非常好奇。 奈何 OpenAI 嘴太严,很长时间以来,大家也都只是猜测这些数据。 不久之前,乔治・霍兹(…
-
下一代语言模型范式LAM崛起!AutoGPT模式席卷LLM,三大组件全面综述:规划、记忆和工具
由ChatGPT掀起的这波AI浪潮已经将我们带入了人工智能时代,语言模型已经成为日常生活中不可或缺的工具。 但目前的语言模型只能响应用户的查询指令,实现一些生成任务,比如写故事、生…
-
一文看懂基础模型的定义和工作原理
译者 | 布加迪 审校 | 重楼 一、基础模型的定义 基础模型是立足于大量数据上的预训练机器学习模型。这是人工智能(AI)领域的突破性进展。由于能够从大量数据中学习并适应各种任务,…
-
67个主题,11528 个问题,全新中文大模型多任务基准CMMLU发布
MBZUAI,上海交通大学,微软亚洲研究院合作完成了一个全面的中文大模型基准——CMMLU。 它涵盖了 67 个主题,涉及自然科学、社会科学、工程、人文、以及常识等,可以全面地评估…
-
GPT-4 模型架构泄露:包含 1.8 万亿参数、采用混合专家模型
7 月 13 日消息,外媒 Semianalysis 近日对 OpenAI 今年 3 月发布的 GPT-4 大模型进行了揭秘,其中包括 GPT-4 模型架构、训练和推理的基础设施、…
-
除了ChatGPT,还有14个你不可不知的大模型
许多老板将人工智能视为未来,许多技术领导者将ChatGPT视为人工智能的代名词。但ChatGPT并非唯一的大型语言模型,对于某些软件项目或领域而言,它甚至可能不是最佳选择。新的竞争…
-
专访Gonex CEO温梦飞:应用领域,意图识别比模型本身更重要!
嘉宾 | 温梦飞 采访&撰稿 | 云昭 潮至千艘动,涛喧万鼓鸣。生成式AI的魔法,征服了千行百业。高涨的呼声之中,我们迎来了现代科技的航海时代,开启了以ChatG…
-
李飞飞「具身智能」新成果!机器人接入大模型直接听懂人话,0预训练就能完成复杂指令
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 李飞飞团队具身智能最新成果来了: 大模型接入机器人,把复杂指令转化成具体行动规划,无需额外数据和训练。…
-
大模型训练成本降低近一半!新加坡国立大学最新优化器已投入使用
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 优化器在大语言模型的训练中占据了大量内存资源。 现在有一种新的优化方式,在性能保持不变的情况下将内存消…
-
腾讯TRS之元学习与跨域推荐的工业实战
一、元学习 1、个性化建模的痛点 在推荐场景会遇到数据二八分布的问题,20%的场景应用80%的样本,这就导致一个问题:单模型对大场景预估更友好。如何兼顾各场景,提升模型个性化能力是…