模型
-
ChatGPT引领AIGC!Lehigh最新《AI生成内容》全面综述,44页详述GAN到ChatGPT发展历程
ChatGPT和其他生成式AI (GAI)技术属于人工智能生成内容(AIGC)的范畴,它涉及通过AI模型创建数字内容,如图像、音乐和自然语言。AIGC的目标是使内容创建过程更加高效…
-
ChatGPT是如何做到一个字一个字输出的?
ChatGPT回答问题时,是一个字一个字弹出的,给人一种在认真思考的感觉。 这段对话的基本内容是: 问:大语言生成式模型是如何工作的答:大型语言生成模型(如GPT-3)是基于深度学…
-
AI大模型背后,竟是惊人的碳排放
自从ChatGPT这样的大型语言模型在全球引起轰动以来,很少有人注意到,训练和运行大型语言模型正在产生惊人的碳排放量。 虽然OpenAI和谷歌都没有说过他们各自产品的计算成本是多少…
-
图像生成终结扩散模型,OpenAI「一致性模型」加冕!GAN的速度一步生图,高达18FPS
ChatGPT、Midjourney的火爆,让其背后技术扩散模型成为「生成式AI」革命的基础。 甚至,还受到业内研究者极力追捧,其风头远远盖过曾经逆袭天下的GAN。 就在扩散模型最…
-
谷歌大模型云服务上线,代码生成、PaLM for Chat首次亮相
上周末,谷歌宣布基于 Vertex AI 的生成式人工智能服务全面上线了。 Vertex AI 是谷歌云提供的机器学习平台服务(ML PaaS)。随着本次发布,谷歌大模型的服务已普…
-
小羊驼背后的英雄,伯克利开源LLM推理与服务库:GPU减半、吞吐数十倍猛增
随着大语言模型(LLM)的不断发展,这些模型在很大程度上改变了人类使用 AI 的方式。然而,实际上为这些模型提供服务仍然存在挑战,即使在昂贵的硬件上也可能慢得惊人。 现在这种限制正…
-
ChatGPT的背后原理:大模型、注意力机制、强化学习
本文主要介绍为ChatGPT提供动力的机器学习模型,将从大型语言模型的介绍开始,深入探讨使GPT-3得到训练的革命性的自注意机制,然后深入到从人类反馈强化学习,这是使ChatGPT…
-
基于重排序的新量化方法RPTQ:实现大型语言模型的 3 比特量化
大型语言模型(LLMs)在各种任务上表现出色,但由于其庞大的模型规模,部署方面存在挑战。 在这篇论文中,来自后摩智能、腾讯 AI Lab、华中科技大学、北京大学、伊利诺伊理工学院的…
-
看ChatGPT这形势,留给我们开发人员的时间不多了
随着人工智能技术的不断发展和应用,职场上出现了一种新的职业角色——Chatbot生成模型,例如OpenAI的GPT模型。这些模型可以模拟人类的自然语言交流,从而代替人类完成一些重复…
-
谷歌 DeepMind 自曝正开发新型 AI 模型 Gemini,号称“比 GPT-4 强”
6 月 28 日消息,在上个月的谷歌(Google) I / O 开发者大会上,谷歌公司首次透露了其正在开发的大型语言模型 Gemini。现据 Wired 报道,DeepMind …
-
玩不起RLHF?港科大开源高效对齐算法RAFT「木筏」,GPT扩散模型都能用
开源大模型火爆,已有大小羊驼LLaMA、Vicuna等很多可选。 但这些羊驼们玩起来经常没有ChatGPT效果好,比如总说自己只是一个语言模型、没有感情blabla,拒绝和用户交朋…
-
这个懂中文的AI高手,画出的高山明月太惊艳!中英双语AltDiffusion模型已开源
日前,智源研究院大模型研究团队开源最新双语 AltDiffusion 模型,为中文世界带来专业级 AI 文图创作的强劲动力: 支持精细长中文 Prompts 高级创作;无需文化转译…