模型
-
最快下月!地表最强语言模型GPT-4发布在即?CEO暗示:已通过图灵测试
作为史上最受期待的AI模型,GPT-4真要来了? 这几天,AI分析师罗梅罗的一篇专栏文章,一经推出便迅速「引爆」了整个AI科技圈。 他表示,「GPT-4几乎准备就绪,并将于今年12…
-
视觉大模型训练和推理加速
大家好,我是来自 NVIDIA GPU 计算专家团队的陶砺,很高兴今天有机会在这里跟大家分享一下我和我的同事陈庾,在 Swin Transformer 这个视觉大模的型训练和推理优…
-
清北微软深挖GPT,把上下文学习整明白了!和微调基本一致,只是参数没变而已
大型预训练语言模型其中一个重要的特点就是上下文学习(In-Context Learning,ICL)能力,即通过一些示范性的输入-标签对,就可以在不更新参数的情况下对新输入的标签进…
-
英伟达「一句话生成3D模型」碾压谷歌:分辨率清晰八倍,速度快两倍,编辑文本还可直接修改
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 一句话生成3D模型,英伟达也来“秀肌肉”了~ 来看它最新捣鼓出的Magic3D AI,效果是…
-
Stable Diffusion采样速度翻倍!仅需10到25步的扩散模型采样算法
要说 AI 领域今年影响力最大的进展,爆火的 AI 作图绝对是其中之一。设计者只需要输入对图片的文字描述,就可以由 AI 生成一张质量极高的高分辨率图片。目前,使用范围最广的当属 …
-
参数减半、与CLIP一样好,视觉Transformer从像素入手实现图像文本统一
近年来,基于 Transformer 的大规模多模态训练促成了不同领域最新技术的改进,包括视觉、语言和音频。特别是在计算机视觉和图像语言理解方面,单个预训练大模型可以优于特定任务的…
-
上海数字大脑研究院发布国内首个多模态决策大模型DB1,可实现超复杂问题快速决策
近日,上海数字大脑研究院(以下简称 “数研院”)推出首个数字大脑多模态决策大模型(简称 DB1),填补了国内在此方面的空白,进一步验证了预训练模型在文本、图 – 文、强…
-
100亿参数的语言模型跑不动?MIT华人博士提出SmoothQuant量化,内存需求直降一半,速度提升1.56倍!
大型语言模型(LLM)虽然性能强劲,但动辄几百上千亿的参数量,对计算设备还是内存的需求量之大,都不是一般公司能承受得住的。 量化(Quantization)是常见的压缩操作,通过降…
-
AI 大模型开源困境:垄断、围墙与算力之殇
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 2020年6月,OpenAI发布GPT-3,其千亿参数的规模和惊人的语言处理能力曾给国内AI界带来极大…
-
AI降维打击人类画家,文生图引入ControlNet,深度、边缘信息全能复用
随着大型文本 – 图像模型的出现,生成一幅吸引人的图像已经变得非常简单,用户需要做的就是动动手指输入简单的 prompt 就可以。通过一系列操作得到图像后,我们不免又会…
-
TensorFlow应用技术拓展—图像分类
1.科研平台环境部署操作拓展 针对于机器学习中的模型训练,本人推荐大家多学习TensorFlow官方的课程或资源,比如中国大学MOOC上的两门课程《 TensorFlow 入门…
-
首个ChatGPT国产平替来了!ChatYuan发布测试版,无需注册,体验完全免费
还在想方设法注册体验ChatGPT吗?不用那么麻烦了! 中文NLP社区也迎来了自己的ChatGPT,最近元语智能开发团队训练了一个叫做元语AI(ChatYuan)的模型,它通过对话…