模型
-
羊驼家族大模型集体进化!32k上下文追平GPT-4,田渊栋团队出品
开源羊驼大模型LLaMA上下文追平GPT-4,只需要一个简单改动! Meta AI这篇刚刚提交的论文表示,LLaMA上下文窗口从2k扩展到32k后只需要小于1000步的微调。 与预…
-
Huggingface榜首开源模型惹争议:魔改Apache协议,达到一定门槛要收钱
我们知道,Huggingface 是 AI 领域著名的开源平台,任何人和机构都可以在该平台上发布自己以及使用他人的模型、数据集,为业内提供了研究便利。因此它深受 AI 圈的喜爱,其…
-
LazyPredict:为你选择最佳ML模型!
摘要 本文讨论使用LazyPredict来创建简单的ML模型。LazyPredict创建机器学习模型的特点是不需要大量的代码,同时在不修改参数的情况下进行多模型拟合,从而在众多模型…
-
模块化大模型来了!IBM公开WastonX核心架构技术细节
大型语言模型(LLMs)的性能非常强大,但是现有的模型训练和部署成本都很高。而且在不忘记先前知识的前提,扩展它们去学习新的知识也很困难。也很难针对特定的任务去提取出轻量化的模型。 …
-
给表情包都能猜电影,ChatGPT的「涌现」能力是哪儿来的?
在正式介绍这篇文章之前,我们先提个问题:下图的表情符号描述的是什么电影呢? 可能连你都猜不出来,这四个符号代表的电影是「海底总动员」,这一提示任务是去年评测大型语言模型(LLM)2…
-
基于 ChatGLM-6B 部署本地私有化 ChatGPT
最近chatGPT很火,但是用起来需要翻墙,国内也有很多模型,什么百度的文心一言、阿里的盘古、还有科大讯飞的模型等等,那么今天我们就来介绍下怎么在本地自己部署自己的聊天模型,也可以…
-
Meta 发布“类人”人工智能模型 I-JEPA,能根据对世界的理解填补图像缺失
6 月 14 日消息,社交媒体巨头 Meta 公司(原 Facebook)周二宣布,将向研究人员开放一种新的“类人”人工智能模型的部分组件,该模型可以比现有模型更准确地分析和完成未…
-
通用视觉GPT时刻来临?智源推出通用分割模型SegGPT
ChatGPT 引发了语言大模型狂潮,AI 另一个重大领域 —— 视觉 —— 的 GPT 时刻何时到来? 前两天,机器之心介绍了 Meta 最新研究成果 Seg…
-
RLHF中的「RL」是必需的吗?有人用二进制交叉熵直接微调LLM,效果更好
近来,在大型数据集上训练的无监督语言模型已经获得了令人惊讶的能力。然而,这些模型是在具有各种目标、优先事项和技能集的人类生成的数据上训练的,其中一些目标和技能设定未必希望被模仿。 …
-
24小时内、200美元复制RLHF过程,斯坦福开源「羊驼农场」
2 月底,Meta 开源了一个大模型系列 LLaMA(直译为羊驼),参数量从 70 亿到 650 亿不等,被称为 Meta 版 ChatGPT 的雏形。之后斯坦福大学、加州大学伯克…
-
OpenAI文本生成3D模型再升级,数秒完成建模,比Point·E更好用
生成式 AI 大模型是 OpenAI 发力的重点,目前已经推出过文本生成图像模型 DALL-E 和 DALL-E 2,以及今年初基于文本生成 3D 模型的 POINT-E。 近日,…
-
GAN的反击:朱俊彦CVPR新作GigaGAN,出图速度秒杀Stable Diffusion
图像生成是当前 AIGC 领域最热门的方向之一。近期发布的图像生成模型如 DALL・E 2、Imagen、Stable Diffusion 等等,开创了图像生成的新时代,实现了前所…