模型
-
国产乾元2大模型来了:可编程金融文生图,120亿参数,超对称联手复旦出品
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 国产大模型队伍正当“百模大战”之际,现在又添一员—— BBT-2,全称BigBang Tansform…
-
武大版 ChatGPT 大模型 CheeseChat 问世:提供日常咨询、学业帮助
5 月 25 日消息,武汉大学宣布,武大版 ChatGPT 大模型开启内测招募。 据介绍,该模型名为 CheeseChat,基于国家网络安全学院数据智能实验室李晨亮老师团队的 Ch…
-
重磅内幕:OpenAI即将开源新模型!开源社区的繁荣,全靠大厂「施舍」?
就在刚刚,根据The Information的最新爆料,OpenAI即将发布一款全新的开源大语言模型。 虽然目前还不清楚,OpenAI是不是打算利用即将开源的模型,来抢占Vicun…
-
写周报、改代码,连续互动20轮,国产类ChatGPT新玩家「天工」来了
国内的类 ChatGPT 赛道,又来了一个重量级玩家。 4 月 17 日,新⼀代大语言模型「天工」正式开启邀请测试。该模型由昆仑万维与奇点智源联合研发,是国内首个对标 ChatGP…
-
LLM推理提速2.8倍,CMU清华姚班校友提出「投机式推理」引擎SpecInfer,小模型撬动大模型高效推理
随着 ChatGPT 的出现,大规模语言模型(LLM)研究及其应用得到学术界和工业界的广泛关注。一方面,开源的 LLM 模型不断涌现,比如 OPT、BLOOM、LLaMA 等,这些…
-
不对齐,反而性能爆表?130亿模型碾压650亿,Hugging Face大模型排行榜发布
我们知道,大多数模型都具有某种嵌入式对齐方式。 随便举几个例子:Alpaca、Vicuna、WizardLM、MPT-7B-Chat、Wizard-Vicuna、GPT4-X-Vi…
-
训练时间减少71.4%,存储成本节省99.9%,厦大指令调优新方案MMA让羊驼模型实现多模态
MMA 不使用大型神经网络来连接图像编码器和 LLM,而是采用轻量级模块,即适配器,来弥合 LLMs 和 VL 任务之间的差距,同时也实现了图像模型和语言模型的联合优化。同时,MM…
-
百度文心一言在国产模型中倒数?我看懵了
夕小瑶科技说 原创 作者 | 卖萌酱最近几天,我们公众号的社群在纷纷转发一张名为SuperClue 评测的截图。科大讯飞甚至在官号进行了宣传: 由于讯飞星火大…
-
AI大牛周明发布MChat:生成可控,参数规模可负担,顺便官宣了新融资
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 大模型赛道又有融资新动态: 语言大模型玩家澜舟科技,刚刚完成了Pre-A+轮融资。 本轮融资由北京中关…
-
从GPT-3开始,续写Transformer庞大家族系谱
最近,大语言模型军备战争占据了朋友圈的大部分篇幅,关于这些模型能做什么和有什么商业价值,已经有很多文章探讨。然而,作为一个在人工智能领域浸淫多年的小小研究员,我更关注的是这场军备竞…
-
可复现、自动化、低成本、高评估水平,首个自动化评估大模型的大模型PandaLM来了
大模型的发展可谓一日千里,指令微调方法犹如雨后春笋般涌现,大量所谓的 ChatGPT “平替” 大模型相继发布。在大模型的训练与应用开发中,开源、闭源以及自研等各类大模型真实能力的…
-
ChatGPT分享-如何开发一个LLM应用
1背景 ChatGPT引起巨大的业界震撼,各行各业都在讨论大语言模型、通用人工智能。AI经历了五十多年的发展,现在正处于产业结构水平化发展的关键时期。这一变化源于NLP领域范式…