模型
-
从GPT-3开始,续写Transformer庞大家族系谱
最近,大语言模型军备战争占据了朋友圈的大部分篇幅,关于这些模型能做什么和有什么商业价值,已经有很多文章探讨。然而,作为一个在人工智能领域浸淫多年的小小研究员,我更关注的是这场军备竞…
-
放弃RLHF吧!无需手动训练模型价值观,达特茅斯学院华人领衔发布全新对齐算法:「AI社会」是最好的老师
训练大型语言模型的最后一步就是「对齐」(alignment),以确保模型的行为符合既定的人类社会价值观。 相比人类通过「社交互动」获得价值判断共识,当下语言模型更多的是孤立地从训练…
-
研究人员借助 ChatGPT 打造西红柿采摘机器人,展示人工智能无限可能
6 月 8 日消息,最近,一些研究人员借助 ChatGPT 的帮助,打造了一个西红柿采摘机器人。 OpenAI 的 ChatGPT 是一个语言模型,能够处理和理解大量文本数据,并利…
-
LLM推理3倍速!微软发布LLM Accelerator:用参考文本实现无损加速
随着人工智能技术的快速发展,ChatGPT、New Bing、GPT-4 等新产品和新技术陆续发布,基础大模型在诸多应用中将发挥日益重要的作用。 目前的大语言模型大多是自回归模型。…
-
130亿参数,8个A100训练,UC伯克利发布对话模型Koala
自从 Meta 发布并开源了 LLaMA 系列模型,来自斯坦福大学、UC 伯克利等机构的研究者们纷纷在 LLaMA 的基础上进行「二创」,先后推出了 Alpaca、Vicuna 等…
-
这七款基于AI的工具让数据科学家如虎添翼
译者 | 布加迪 审校 | 孙淑娟 本文将讨论七款可以帮助数据科学家提高工作效率的基于AI的工具。这些工具可以帮助自动处理数据清理、特征选择、模型调优之类的任务,直接或间接地使您…
-
OpenAI员工与友商玩起提示词决斗!网友:居然能靠大模型的情商增强推理能力
大模型天花板GPT-4和最强竞品Claude,不光商业上竞争激烈,两家公司的员工私下也“剑拔弩张”了起来: 约战提示词决斗,看谁能在最短时间让AI完成高难度任务。 OpenAI一方…
-
梯度提升算法决策过程的逐步可视化
梯度提升算法是最常用的集成机器学习技术之一,该模型使用弱决策树序列来构建强学习器。这也是XGBoost和LightGBM模型的理论基础,所以在这篇文章中,我们将从头开始构建一个梯度…
-
轻松打造家用版GPT-4!微软开源微调指令集:效果不输原版,中英双语都能用
「指令」(Instruction)是ChatGPT模型取得突破性进展的关键因素,可以让语言模型的输出更符合「人类的偏好」。 但指令的标注工作需要耗费大量的人力,即便有了开源的语言模…
-
大神李沐、快手元老李岩被曝离职后转投大模型,ChatGPT掀起AI创业狂飙
最近,互联网大佬纷纷投身大模型赛道。 昨天,李沐大神离职亚马逊、去做大模型的消息,如同惊雷一般炸响了大家的社交网络。 紧接着,今天又曝出前快手AI核心大佬李岩在2022年离职快手后…
-
垂直大模型竞争,能突破数据“卡点”吗?
AI大模型火遍全球,中国产业也激发了对人工智能应用的新热情。 随着各大厂商参与竞逐,市场正在分化为通用与垂直两大路径,两者在参数级别、应用场景、商业模式等方面差异已逐步显现。 1.…
-
Prompt一键抠图!Meta发布史上首个图像分割基础模型,开创CV新范式
就在刚刚,Meta AI发布了Segment Anything Model(SAM)——第一个图像分割基础模型。 SAM能从照片或视频中对任意对象实现一键分割,并且能够零样本迁移到…