模型
-
看不下去AI胡说八道,英伟达出手给大模型安了个“护栏”
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 大模型们胡说八道太严重,英伟达看不下去了。 他们正式推出了一个新工具,帮助大模型说该说的话,并回避不应…
-
AI大模型竞相绽放,科技巨头为何纷纷布局?
毫无疑问,AI大模型已成为当下人工智能产业发展的一个主旋律。自2022年11月上线以来,ChatGPT概念持续发酵,全球科技巨头开始竞相发布AI大模型产品,可谓是你方唱罢我登场。如…
-
时间序列也能和大模型结合?亚马逊最新工作,大模型可解释时序预测
这几天亚马逊发布了一篇使用大模型做时间序列预测的工作,属于大模型在时序预测中的第一次探索,利用大模型提升金融场景预测中的多模态数据处理能力和可解释能力。这篇文章属于一个比较有意思的…
-
一文解决所有「语言模型」疑问:能不能训多个epoch?怎么微调效率高?需要多少条数据?
过去几个月里,Meta的LLaMA引领了一场语言模型的开源狂潮,并且随着大众对语言模型训练研究的深入,很多问题也都有了答案。 比如需要人类反馈和强化学习来对齐语言模型吗?语言模型在…
-
DeepSpeed ZeRO++:降低4倍网络通信,显著提高大模型及类ChatGPT模型训练效率
大型 AI 模型正在改变数字世界。基于大型语言模型 (LLM) 的 Turing-NLG、ChatGPT 和 GPT-4 等生成语言模型用途广泛,能够执行摘要、代码生成和翻译等任务…
-
NUS华人团队最新模型,单视图重建3D,又快又准
2D图像的3D重建一直是CV领域的重头戏。 层出不同的模型被开发出来试图攻克这个难题。 今天,新加坡国立大学的学者共同发表了一篇论文,开发了一个全新的框架Anything-3D来解…
-
Prompt一键抠图!Meta发布史上首个图像分割基础模型,开创CV新范式
就在刚刚,Meta AI发布了Segment Anything Model(SAM)——第一个图像分割基础模型。 SAM能从照片或视频中对任意对象实现一键分割,并且能够零样本迁移到…
-
大模型物种进化图转疯了:8位华人打造,一眼看懂“界门纲目”,原来BERT后代已绝种
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 这几天,一张名为“大语言模型进化树”的动图在学术圈疯转: 它清晰梳理了2018到2023五年间所有的大…
-
罗格斯大学华人团队开源OpenAGI平台:语言模型是AGI的入口,领域专家模型不可或缺
人类所具有的智能,可以将一些最基础的能力,通过某种组合变成一种复杂能力,并可以用来解决复杂的、多步骤的任务。 这种能力对人工智能(AI)的发展来说同样重要,在迈向最终的通用人工智能…
-
大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内20余位研究者联合撰写
自 20 世纪 50 年代图灵测试提出以来,人们始终在探索机器处理语言智能的能力。语言本质上是一个错综复杂的人类表达系统,受到语法规则的约束。因此,开发能够理解和精通语言的强大 A…
-
ChatGPT说谎竟然是故意的?哈佛大学提出ITI:模型真实性翻倍,计算开销基本为零
大型语言模型,比如ChatGPT经常会在答案中输出错误信息,可能会对用户造成误导,这种现象也被称为模型幻觉(hallucination)。 从直觉上看,语言模型上在训练中肯定是见过…
-
3.6万亿token、3400亿参数,谷歌大模型PaLM 2细节遭曝光
上周四,在 2023 谷歌 I/O 大会上,谷歌 CEO 皮查伊宣布推出对标 GPT-4 的大模型 PaLM 2,并正式发布预览版本,改进了数学、代码、推理、多语言翻译和自然语言生…