模型

人工智能

国产乾元2大模型来了：可编程金融文生图，120亿参数，超对称联手复旦出品

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。国产大模型队伍正当“百模大战”之际，现在又添一员—— BBT-2，全称BigBang Tansform…

1321
2023年7月17日
000
人工智能

武大版 ChatGPT 大模型 CheeseChat 问世：提供日常咨询、学业帮助

5 月 25 日消息，武汉大学宣布，武大版 ChatGPT 大模型开启内测招募。据介绍，该模型名为 CheeseChat，基于国家网络安全学院数据智能实验室李晨亮老师团队的 Ch…

9731
2023年7月17日
000
人工智能

重磅内幕：OpenAI即将开源新模型！开源社区的繁荣，全靠大厂「施舍」？

就在刚刚，根据The Information的最新爆料，OpenAI即将发布一款全新的开源大语言模型。虽然目前还不清楚，OpenAI是不是打算利用即将开源的模型，来抢占Vicun…

7360
2023年7月17日
000
人工智能

写周报、改代码，连续互动20轮，国产类ChatGPT新玩家「天工」来了

国内的类 ChatGPT 赛道，又来了一个重量级玩家。 4 月 17 日，新⼀代大语言模型「天工」正式开启邀请测试。该模型由昆仑万维与奇点智源联合研发，是国内首个对标 ChatGP…

8604
2023年7月17日
000
人工智能

LLM推理提速2.8倍，CMU清华姚班校友提出「投机式推理」引擎SpecInfer，小模型撬动大模型高效推理

随着 ChatGPT 的出现，大规模语言模型（LLM）研究及其应用得到学术界和工业界的广泛关注。一方面，开源的 LLM 模型不断涌现，比如 OPT、BLOOM、LLaMA 等，这些…

Lycoris
2023年7月17日
000
人工智能

不对齐，反而性能爆表？130亿模型碾压650亿，Hugging Face大模型排行榜发布

我们知道，大多数模型都具有某种嵌入式对齐方式。随便举几个例子：Alpaca、Vicuna、WizardLM、MPT-7B-Chat、Wizard-Vicuna、GPT4-X-Vi…

勥蜀黍
2023年7月17日
000
人工智能

训练时间减少71.4%，存储成本节省99.9%，厦大指令调优新方案MMA让羊驼模型实现多模态

MMA 不使用大型神经网络来连接图像编码器和 LLM，而是采用轻量级模块，即适配器，来弥合 LLMs 和 VL 任务之间的差距，同时也实现了图像模型和语言模型的联合优化。同时，MM…

0673
2023年7月17日
000
人工智能

百度文心一言在国产模型中倒数？我看懵了

夕小瑶科技说原创作者 | 卖萌酱最近几天，我们公众号的社群在纷纷转发一张名为SuperClue 评测的截图。科大讯飞甚至在官号进行了宣传：由于讯飞星火大…

2930
2023年7月17日
000
人工智能

AI大牛周明发布MChat：生成可控，参数规模可负担，顺便官宣了新融资

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。大模型赛道又有融资新动态：语言大模型玩家澜舟科技，刚刚完成了Pre-A+轮融资。本轮融资由北京中关…

1038
2023年7月17日
000
人工智能

从GPT-3开始，续写Transformer庞大家族系谱

最近，大语言模型军备战争占据了朋友圈的大部分篇幅，关于这些模型能做什么和有什么商业价值，已经有很多文章探讨。然而，作为一个在人工智能领域浸淫多年的小小研究员，我更关注的是这场军备竞…

8075
2023年7月17日
000
人工智能

可复现、自动化、低成本、高评估水平，首个自动化评估大模型的大模型PandaLM来了

大模型的发展可谓一日千里，指令微调方法犹如雨后春笋般涌现，大量所谓的 ChatGPT “平替” 大模型相继发布。在大模型的训练与应用开发中，开源、闭源以及自研等各类大模型真实能力的…

3880
2023年7月17日
000
人工智能

ChatGPT分享-如何开发一个LLM应用

1背景 ChatGPT引起巨大的业界震撼，各行各业都在讨论大语言模型、通用人工智能。AI经历了五十多年的发展，现在正处于产业结构水平化发展的关键时期。这一变化源于NLP领域范式…

煎蛋
2023年7月17日
000

6 / 45
3
4
5
6
7
8
9