模型

人工智能

「成熟」大模型才能涌现？MIT：GPT-4能自我纠错代码，GPT-3.5却不行

我们都知道，大语言模型在生成代码方面，表现出了非凡的能力。然而，在具有挑战性的编程任务（比如竞赛和软件工程师的面试）中，它们却完成得并不好。好在，很多模型会通过一种自修复工作流来…

Dada
2023年7月17日
000
人工智能

首次发现！数据异构影响联邦学习模型，关键在于表征维度坍缩

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。随着深度学习大获成功，保护用户数据隐私变得越来越重要。联邦学习（Federated Learning…

Ξ　Miracle　Ξ
2023年7月17日
000
人工智能

GPT模型中的数据中心型AI揭秘

译者 | 朱先忠审校 | 重楼图像来自文章https://arxiv.org/abs/2303.10158，由作者本人制作人工智能在改变我们的生活、工作和与技术互动的方…

0008
2023年7月17日
000
人工智能

进击AGI时代，云知声山海大模型重磅发布

逐云破浪，奔赴山海。5月24日，云知声山海大模型暨成果发布会在北京举办，现场实测山海大模型十大核心能力，并发布一系列面向不同行业需求的产品应用。云知声山海大模型正式发布云知声创…

╰┳形^影┳╯
2023年7月17日
000
人工智能

解读ChatGPT中的RLHF

无论是 ChatGPT 还是 GPT-4，它们的核心技术机制之一都是基于人类反馈的强化学习（Reinforcement Learning from Human Feedback，R…

8340
2023年7月17日
000
人工智能

蒸馏也能Step-by-Step：新方法让小模型也能媲美2000倍体量大模型

大型语言模型能力惊人，但在部署过程中往往由于规模而消耗巨大的成本。华盛顿大学联合谷歌云计算人工智能研究院、谷歌研究院针对该问题进行了进一步解决，提出了逐步蒸馏（Distilling…

Ξ　Miracle　Ξ
2023年7月17日
000
人工智能

绕开算力限制，如何用单GPU微调 LLM？这是一份「梯度累积」算法教程

自从大模型变成热门趋势之后，GPU 就成了紧俏的物资。很多企业的储备都不一定充足，更不用说个人开发者了。有没有什么方法可以更高效的利用算力训练模型？在最近的一篇博客，Sebast…

汉墨堂-总部
2023年7月17日
000
人工智能

Google内部文档泄露：开源大模型太可怕了，OpenAI也顶不住！

今天看到一篇文章，说是Google泄露了一份文档《我们没有护城河，OpenAI也没有》，描述了某位Google员工（非Google公司）对开源AI的看法，观点很有意思，大致的意思是…

9455
2023年7月17日
000
人工智能

CV开启大模型时代！谷歌发布史上最大ViT：220亿参数，视觉感知力直逼人类

Transformer无疑是促进自然语言处理领域繁荣的最大功臣，也是GPT-4等大规模语言模型的基础架构。不过相比语言模型动辄成千上万亿的参数量，计算机视觉领域吃到Transfo…

liangwen
2023年7月17日
000
人工智能

微软拟向美国国防部、NASA等机构开放GPT-4大模型

6月8日消息，美国当地时间周三，微软公司宣布将向其Azure Government云计算服务客户开放OpenAI的人工智能模型。这些客户包括多家美国政府机构，它们将能够访问GPT-…

liubo
2023年7月17日
000
人工智能

这七款基于AI的工具让数据科学家如虎添翼

译者 | 布加迪审校 | 孙淑娟本文将讨论七款可以帮助数据科学家提高工作效率的基于AI的工具。这些工具可以帮助自动处理数据清理、特征选择、模型调优之类的任务，直接或间接地使您…

7703
2023年7月17日
000
人工智能

目前可以从ChatGPT中受益的三大行业

ChatGPT和相关的人工智能技术在各行业领域都备受关注，但它们能为哪些行业提供实际应用呢? ChatGPT如今已经风靡全球，这个大型语言模型(LLM)在发布两个月后拥有了1亿个活…

4701
2023年7月17日
000

10 / 45
7
8
9
10
11
12
13