模型
-
过去三个月,LLaMA系模型发展如何?指令微调的核心问题又是什么?
符尧(yao.fu@ed.ac.uk),爱丁堡大学 (University of Edinburgh) 博士生,本科毕业于北京大学。 ChatGPT 大火之后,在 2023 年 2…
-
小米大模型能让雷军OK吗?
51CTO读者成长计划社群招募,咨询小助手(微信号:CTOjishuzhan) 作者 | 徐杰承 当一句令人熟悉无比且略带咖喱味的“Are you OK?”响起时,我们就知道,雷布…
-
大模型知识Out该怎么办?浙大团队探索大模型参数更新的方法—模型编辑
夕小瑶科技说 原创 作者 | 小戏、Python 大模型在其巨大体量背后蕴藏着一个直观的问题:“大模型应该怎么更新?” 在大模型极其巨大的计算开销下,大模型知识的更新并不…
-
亚马逊高调入局ChatGPT大战,发布Titan大模型、AI编程助手全免费,CEO:改变所有体验
一夜之间,亚马逊来了个「弯道超车」。 在全球各大科技巨头都在拥抱如今最火的大模型、AIGC 的时候,亚马逊给人的印象只有一个:隐身。 虽然 AWS 一直在为 Hugging Fac…
-
微软向美国政府提供GPT的大模型,安全性如何保证?
微软公司在6月7日发布了一篇博客,宣布将向美国政府机构提供OpenAI人工智能大模型,利用其Azure云服务的能力。这是微软首次将GPT技术引入政府机构,同时也是全球首个将以GPT…
-
有证据了,MIT表明:大型语言模型≠随机鹦鹉,确实能学到语义
虽然大型预训练语言模型(LLM)在一系列下游任务中展现出飞速提升的性能,但它们是否真的理解其使用和生成的文本语义? 长期以来,AI社区对这一问题存在很大的分歧。有一种猜测是,纯粹基…
-
精通ChatGPT等大模型,掌握最前沿技术,这有份绝佳资源
最近几个月,要问 AI 界最出圈的模型有哪些,首当其冲应该是 OpenAI 相继发布的 ChatGPT、GPT-4 等模型,这些智能模型极大地改变了人类思考和处理问题的方式,进而可…
-
解读Toolformer
大语言模型(LLM)在利用有限的文本数据解决新任务方面表现出令人难以置信的优势。然而,尽管如此,它们在其他方面也有局限性,例如: 无法访问最新信息 幻想事实的倾向 低资源语言的困难…
-
斯坦福最新研究警告:别太迷信大模型涌现能力,那是度量选择的结果
「别太迷信大模型的涌现,世界上哪儿有那么多奇迹?」斯坦福大学的研究者发现,大模型的涌现与任务的评价指标强相关,并非模型行为在特定任务和规模下的基本变化,换一些更连续、平滑的指标后,…
-
IBM加入战局!任意大模型低成本变ChatGPT方法开源,个别任务超GPT-4
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 科幻中有机器人三原则,IBM说不够,要十六原则。 最新大模型研究工作中,以十六原则为基础,IBM让AI…
-
开源模型 PrivateGPT 上线,可本地搭建、避免信息外泄
6 月 25 日消息,三星、摩根大通、苹果和亚马逊等公司已明令要求,由于担心公司机密信息外泄,禁止员工使用 ChatGPT。 开发者 Iván Martínez Toro 近日推出…
-
开发者笑疯了! LLaMa惊天泄露引爆ChatGPT平替狂潮,开源LLM领域变天
谁能想到,一次意外的LLaMA泄漏,竟点燃了开源LLM领域最大的创新火花。 一系列表现出色的ChatGPT开源替代品——「羊驼家族」,随后眼花缭乱地登场。 开源和基于 API 的分…