模型
-
Nature:AI模型越大越好吗?
现在,生成式人工智能模型变得越来越大了,所以更大就意味着更好吗? 非也。现在,一些科学家提议,应该采用更精简、更节能的系统。 文章地址:https://www.nature.co…
-
最新RLHF拯救语言模型「胡说八道」!微调效果比ChatGPT更好,两名华人共同一作
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 RLHF(基于人类反馈的强化学习)的一大缺点,终于被解决了! 没错,虽然RLHF是大语言模型“核心技巧…
-
超参数优化比较之网格搜索、随机搜索和贝叶斯优化
译者 | 朱先忠 审校 | 孙淑娟 简介 通常,在尝试改进机器学习模型时,人们首先想到的解决方案是添加更多的训练数据。额外的数据通常是有帮助(在某些情况下除外)的,但生成高质…
-
研究人员使用人工智能预测电力需求
在过去的几十年里,对于供应商和电网管理者来说,寻找更准确的方法来预测能源消耗一直是一项毫无结果的活动,因为大多数电网仍然依赖于主要参考消费历史和天气预报的预测模型。 公路和铁路交通…
-
AI大模型非常昂贵 只有大企业和超级富豪才能玩得转
ChatGPT大火带动AI又一波热潮,不过业界普遍认为,当AI 步入大模型时代,只有大企业和超级富有的企业才玩得起AI,因为AI大模型的打造非常昂贵。 首先是计算昂贵。多伦多大学市…
-
到底什么样的网络,才能带得动AIGC?
2023年,是AI人工智能技术全面爆红的一年。 以ChatGPT、GPT-4、文心一言为代表的AIGC大模型,集文本撰写、代码开发、诗词创作等功能于一体,展现出了超强的内容生产能…
-
玩不起RLHF?港科大开源高效对齐算法RAFT「木筏」,GPT扩散模型都能用
开源大模型火爆,已有大小羊驼LLaMA、Vicuna等很多可选。 但这些羊驼们玩起来经常没有ChatGPT效果好,比如总说自己只是一个语言模型、没有感情blabla,拒绝和用户交朋…
-
MathGPT来了!专攻数学大模型,解题讲题两手抓
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 大模型领域又来新玩家。 据了解,学而思正在进行自研数学大模型的研发,命名为MathGPT。 面向全球数…
-
华人科学团队推出「思维链集」,全面测评大模型复杂推理能力
大模型能力涌现,参数规模越大越好? 然而,越来越多的研究人员声称,小于10B的模型也可以实现与GPT-3.5相当的性能。 真是如此吗? OpenAI发布GPT-4的博客中,曾提到:…
-
模块化MoE将成为视觉多任务学习基础模型
多任务学习(MTL)存在很多挑战,因为不同任务之间的梯度可能矛盾。为了利用任务之间的关联,作者引入了 Mod-Squad 模型,它是多个专家组成的模块化模型。模型可以灵活优化任务和…
-
盘点几款AI作图工具,让你不再为找图而烦恼
huggingface[1] huggingface 是一家美国 AI 公司,它提供了开发使用机器学习构建应用程序的工具。 它提供了构建自然语言的 Transformers 库,允…
-
超越所有开源模型,击败 Claude、Bard,专门用于编程任务的大模型来了
最近一段时间,随着大语言模型(LLM)的不断发布,LLM 排位赛也变得火热起来,研究者们试图在新的 LLM 评测系统中不断刷新自家模型的分数。 在这当中,斯坦福发布的全新大语言模型…