模型
-
650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了
在大模型方向上,科技巨头在训更大的模型,学界则在想办法搞优化。最近,优化算力的方法又上升到了新的高度。 大型语言模型(LLM)彻底改变了自然语言处理(NLP)领域,展示了涌现、顿悟…
-
离视觉大一统更近一步:分割一切之后,Meta又开源一组多用途大模型
在开源了「分割一切」的 SAM 模型后,Meta 在「视觉基础模型」的路上越走越远。 这次,他们开源的是一组名叫 DINOv2 的模型。这些模型能产生高性能的视觉表征,无需微调就能…
-
ChatGPT如何帮助企业获得更多的收入
最近几个月来,几乎每天都有关于生成式人工智能或ChatGPT的头条新闻。突然之间,人工智能又变得炙手可热,每个人都想加入这个技术潮流:企业家想创办人工智能公司,企业高管想把人工智能…
-
思维链如何释放语言模型的隐藏能力?最新理论研究揭示其背后奥秘
思维链提示(CoT)是大模型涌现中最神秘的现象之一,尤其在解决数学推理和决策问题中取得了惊艳效果。CoT到底有多重要呢?它背后成功的机制是什么?本文中,北大的几位研究者证明了CoT…
-
时下改变AI的六大NLP语言模型
译者 | 陈峻 审校 | 重楼 51CTO读者成长计划社群招募,咨询小助手(微信号:CTOjishuzhan) 本文将深入研究大语言模型领域的最新进展,改变AI的6大NLP语言模型…
-
少用ChatGPT,多支持开源!纽约大学教授Nature发文:为了科学界的未来
免费的ChatGPT用的是很爽,但这种闭源的语言模型最大的缺点就是不开源,外界根本无法了解背后的训练数据以及是否会泄露用户隐私等问题,也引发了后续工业界、学术界联合开源了LLaMA…
-
当GPT-4反思自己错了:性能提升近30%,编程能力提升21%
人类在做错事时,会反思自己的行为,避免再次出错,如果让 GPT-4 这类大型语言模型也具备反思能力,性能不知道要提高多少了。 众所周知,大型语言模型 (LLM) 在各种任务上已经表…
-
人工智能和 5G 在边缘更好
我们的世界充满了激动人心的技术,这些技术有望为企业开启新的可能性。 在某些情况下,两种新兴技术的融合会放大两者的优势,而 AI 和 5G 就是此类互补技术的完美示例。 每一种都有巨…
-
少样本学习综述:技术、算法和模型
机器学习最近取得了很大的进展,但仍然有一个主要的挑战:需要大量的标记数据来训练模型。 有时这种数据在现实世界中是无法获得的。以医疗保健为例,我们可能没有足够的x光扫描来检查一种新的…
-
OpenAI 推出 Shap・E:基于文本数秒内生成高质量 3D 模型
5 月 9 日消息,继文本生成图片模型 DALL・E 之后,OpenAI 近日再次发布了 Shap・E 模型。用户可以输入文本,用于创建逼真且多样化的 3D 模型。 Shap・E …
-
ChatGPT原理解析
尽管OpenAI没有公布ChatGPT的论文和相关的训练和技术细节,但我们可以从其兄弟模型InstructGPT以及网络上公开的碎片化的情报中寻找到实现ChatGPT的蛛丝马迹。根…
-
GPT提示的微妙变化
像GPT-4这样的大型语言模型与提示之间的交互是塑造模型响应的关键因素。 提示作为指南,引导模型访问其底层模式和结构。即使是提示措辞的细微变化也会对这些模型生成的输出产生深远影响。…