模型
-
「成熟」大模型才能涌现?MIT:GPT-4能自我纠错代码,GPT-3.5却不行
我们都知道,大语言模型在生成代码方面,表现出了非凡的能力。然而,在具有挑战性的编程任务(比如竞赛和软件工程师的面试)中,它们却完成得并不好。 好在,很多模型会通过一种自修复工作流来…
-
首次发现!数据异构影响联邦学习模型,关键在于表征维度坍缩
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 随着深度学习大获成功,保护用户数据隐私变得越来越重要。 联邦学习(Federated Learning…
-
GPT模型中的数据中心型AI揭秘
译者 | 朱先忠 审校 | 重楼 图像来自文章https://arxiv.org/abs/2303.10158,由作者本人制作 人工智能在改变我们的生活、工作和与技术互动的方…
-
进击AGI时代,云知声山海大模型重磅发布
逐云破浪,奔赴山海。5月24日,云知声山海大模型暨成果发布会在北京举办,现场实测山海大模型十大核心能力,并发布一系列面向不同行业需求的产品应用。 云知声山海大模型正式发布 云知声创…
-
解读ChatGPT中的RLHF
无论是 ChatGPT 还是 GPT-4,它们的核心技术机制之一都是基于人类反馈的强化学习(Reinforcement Learning from Human Feedback,R…
-
蒸馏也能Step-by-Step:新方法让小模型也能媲美2000倍体量大模型
大型语言模型能力惊人,但在部署过程中往往由于规模而消耗巨大的成本。华盛顿大学联合谷歌云计算人工智能研究院、谷歌研究院针对该问题进行了进一步解决,提出了逐步蒸馏(Distilling…
-
绕开算力限制,如何用单GPU微调 LLM?这是一份「梯度累积」算法教程
自从大模型变成热门趋势之后,GPU 就成了紧俏的物资。很多企业的储备都不一定充足,更不用说个人开发者了。有没有什么方法可以更高效的利用算力训练模型? 在最近的一篇博客,Sebast…
-
Google内部文档泄露:开源大模型太可怕了,OpenAI也顶不住!
今天看到一篇文章,说是Google泄露了一份文档《我们没有护城河,OpenAI也没有》,描述了某位Google员工(非Google公司)对开源AI的看法,观点很有意思,大致的意思是…
-
CV开启大模型时代!谷歌发布史上最大ViT:220亿参数,视觉感知力直逼人类
Transformer无疑是促进自然语言处理领域繁荣的最大功臣,也是GPT-4等大规模语言模型的基础架构。 不过相比语言模型动辄成千上万亿的参数量,计算机视觉领域吃到Transfo…
-
微软拟向美国国防部、NASA等机构开放GPT-4大模型
6月8日消息,美国当地时间周三,微软公司宣布将向其Azure Government云计算服务客户开放OpenAI的人工智能模型。这些客户包括多家美国政府机构,它们将能够访问GPT-…
-
这七款基于AI的工具让数据科学家如虎添翼
译者 | 布加迪 审校 | 孙淑娟 本文将讨论七款可以帮助数据科学家提高工作效率的基于AI的工具。这些工具可以帮助自动处理数据清理、特征选择、模型调优之类的任务,直接或间接地使您…
-
目前可以从ChatGPT中受益的三大行业
ChatGPT和相关的人工智能技术在各行业领域都备受关注,但它们能为哪些行业提供实际应用呢? ChatGPT如今已经风靡全球,这个大型语言模型(LLM)在发布两个月后拥有了1亿个活…