模型

人工智能

过去三个月，LLaMA系模型发展如何？指令微调的核心问题又是什么？

符尧（yao.fu@ed.ac.uk），爱丁堡大学 (University of Edinburgh) 博士生，本科毕业于北京大学。 ChatGPT 大火之后，在 2023 年 2…

6359
2023年7月17日
000
人工智能

小米大模型能让雷军OK吗？

51CTO读者成长计划社群招募，咨询小助手（微信号：CTOjishuzhan）作者 | 徐杰承当一句令人熟悉无比且略带咖喱味的“Are you OK？”响起时，我们就知道，雷布…

栀子花开
2023年7月17日
000
人工智能

大模型知识Out该怎么办？浙大团队探索大模型参数更新的方法—模型编辑

夕小瑶科技说原创作者 | 小戏、Python 大模型在其巨大体量背后蕴藏着一个直观的问题：“大模型应该怎么更新？” 在大模型极其巨大的计算开销下，大模型知识的更新并不…

9223
2023年7月17日
000
人工智能

亚马逊高调入局ChatGPT大战，发布Titan大模型、AI编程助手全免费，CEO：改变所有体验

一夜之间，亚马逊来了个「弯道超车」。在全球各大科技巨头都在拥抱如今最火的大模型、AIGC 的时候，亚马逊给人的印象只有一个：隐身。虽然 AWS 一直在为 Hugging Fac…

6359
2023年7月17日
000
人工智能

微软向美国政府提供GPT的大模型，安全性如何保证？

微软公司在6月7日发布了一篇博客，宣布将向美国政府机构提供OpenAI人工智能大模型，利用其Azure云服务的能力。这是微软首次将GPT技术引入政府机构，同时也是全球首个将以GPT…

TT8
2023年7月17日
000
人工智能

有证据了，MIT表明：大型语言模型≠随机鹦鹉，确实能学到语义

虽然大型预训练语言模型（LLM）在一系列下游任务中展现出飞速提升的性能，但它们是否真的理解其使用和生成的文本语义？长期以来，AI社区对这一问题存在很大的分歧。有一种猜测是，纯粹基…

5037
2023年7月17日
000
人工智能

精通ChatGPT等大模型，掌握最前沿技术，这有份绝佳资源

最近几个月，要问 AI 界最出圈的模型有哪些，首当其冲应该是 OpenAI 相继发布的 ChatGPT、GPT-4 等模型，这些智能模型极大地改变了人类思考和处理问题的方式，进而可…

1321
2023年7月17日
000
人工智能

解读Toolformer

大语言模型（LLM）在利用有限的文本数据解决新任务方面表现出令人难以置信的优势。然而，尽管如此，它们在其他方面也有局限性，例如：无法访问最新信息幻想事实的倾向低资源语言的困难…

0481
2023年7月17日
000
人工智能

斯坦福最新研究警告：别太迷信大模型涌现能力，那是度量选择的结果

「别太迷信大模型的涌现，世界上哪儿有那么多奇迹？」斯坦福大学的研究者发现，大模型的涌现与任务的评价指标强相关，并非模型行为在特定任务和规模下的基本变化，换一些更连续、平滑的指标后，…

阿酷
2023年7月17日
000
人工智能

IBM加入战局！任意大模型低成本变ChatGPT方法开源，个别任务超GPT-4

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。科幻中有机器人三原则，IBM说不够，要十六原则。最新大模型研究工作中，以十六原则为基础，IBM让AI…

5055
2023年7月17日
000
人工智能

开源模型 PrivateGPT 上线，可本地搭建、避免信息外泄

6 月 25 日消息，三星、摩根大通、苹果和亚马逊等公司已明令要求，由于担心公司机密信息外泄，禁止员工使用 ChatGPT。开发者 Iván Martínez Toro 近日推出…

VitLint
2023年7月17日
000
人工智能

开发者笑疯了！ LLaMa惊天泄露引爆ChatGPT平替狂潮，开源LLM领域变天

谁能想到，一次意外的LLaMA泄漏，竟点燃了开源LLM领域最大的创新火花。一系列表现出色的ChatGPT开源替代品——「羊驼家族」，随后眼花缭乱地登场。开源和基于 API 的分…

汉墨堂-总部
2023年7月17日
000

11 / 45
8
9
10
11
12
13
14