模型

人工智能

羊驼家族大模型集体进化！32k上下文追平GPT-4，田渊栋团队出品

开源羊驼大模型LLaMA上下文追平GPT-4，只需要一个简单改动！ Meta AI这篇刚刚提交的论文表示，LLaMA上下文窗口从2k扩展到32k后只需要小于1000步的微调。与预…

漫道
2023年7月17日
000
人工智能

Huggingface榜首开源模型惹争议：魔改Apache协议，达到一定门槛要收钱

我们知道，Huggingface 是 AI 领域著名的开源平台，任何人和机构都可以在该平台上发布自己以及使用他人的模型、数据集，为业内提供了研究便利。因此它深受 AI 圈的喜爱，其…

9200
2023年7月17日
000
人工智能

LazyPredict：为你选择最佳ML模型！

摘要本文讨论使用LazyPredict来创建简单的ML模型。LazyPredict创建机器学习模型的特点是不需要大量的代码，同时在不修改参数的情况下进行多模型拟合，从而在众多模型…

三七
2023年7月17日
000
人工智能

模块化大模型来了！IBM公开WastonX核心架构技术细节

大型语言模型（LLMs）的性能非常强大，但是现有的模型训练和部署成本都很高。而且在不忘记先前知识的前提，扩展它们去学习新的知识也很困难。也很难针对特定的任务去提取出轻量化的模型。 …

嘿，我的小可爱
2023年7月17日
000
人工智能

给表情包都能猜电影，ChatGPT的「涌现」能力是哪儿来的？

在正式介绍这篇文章之前，我们先提个问题：下图的表情符号描述的是什么电影呢？可能连你都猜不出来，这四个符号代表的电影是「海底总动员」，这一提示任务是去年评测大型语言模型（LLM）2…

6345
2023年7月17日
000
人工智能

基于 ChatGLM-6B 部署本地私有化 ChatGPT

最近chatGPT很火，但是用起来需要翻墙，国内也有很多模型，什么百度的文心一言、阿里的盘古、还有科大讯飞的模型等等，那么今天我们就来介绍下怎么在本地自己部署自己的聊天模型，也可以…

蒲公英飞走了
2023年7月17日
000
人工智能

Meta 发布“类人”人工智能模型 I-JEPA，能根据对世界的理解填补图像缺失

6 月 14 日消息，社交媒体巨头 Meta 公司（原 Facebook）周二宣布，将向研究人员开放一种新的“类人”人工智能模型的部分组件，该模型可以比现有模型更准确地分析和完成未…

云南浪者
2023年7月17日
000
人工智能

通用视觉GPT时刻来临？智源推出通用分割模型SegGPT

ChatGPT 引发了语言大模型狂潮，AI 另一个重大领域 —— 视觉 —— 的 GPT 时刻何时到来？前两天，机器之心介绍了 Meta 最新研究成果 Seg…

8253
2023年7月17日
000
人工智能

RLHF中的「RL」是必需的吗？有人用二进制交叉熵直接微调LLM，效果更好

近来，在大型数据集上训练的无监督语言模型已经获得了令人惊讶的能力。然而，这些模型是在具有各种目标、优先事项和技能集的人类生成的数据上训练的，其中一些目标和技能设定未必希望被模仿。 …

3560
2023年7月17日
000
人工智能

24小时内、200美元复制RLHF过程，斯坦福开源「羊驼农场」

2 月底，Meta 开源了一个大模型系列 LLaMA（直译为羊驼），参数量从 70 亿到 650 亿不等，被称为 Meta 版 ChatGPT 的雏形。之后斯坦福大学、加州大学伯克…

古月今人
2023年7月17日
000
人工智能

OpenAI文本生成3D模型再升级，数秒完成建模，比Point·E更好用

生成式 AI 大模型是 OpenAI 发力的重点，目前已经推出过文本生成图像模型 DALL-E 和 DALL-E 2，以及今年初基于文本生成 3D 模型的 POINT-E。近日，…

╰┳形^影┳╯
2023年7月17日
000
人工智能

GAN的反击：朱俊彦CVPR新作GigaGAN，出图速度秒杀Stable Diffusion

图像生成是当前 AIGC 领域最热门的方向之一。近期发布的图像生成模型如 DALL・E 2、Imagen、Stable Diffusion 等等，开创了图像生成的新时代，实现了前所…

skkkkkkkkk
2023年7月17日
000

22 / 45
19
20
21
22
23
24
25