模型
-
大模型训练成本降低近一半!新加坡国立大学最新优化器已投入使用
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 优化器在大语言模型的训练中占据了大量内存资源。 现在有一种新的优化方式,在性能保持不变的情况下将内存消…
-
腾讯TRS之元学习与跨域推荐的工业实战
一、元学习 1、个性化建模的痛点 在推荐场景会遇到数据二八分布的问题,20%的场景应用80%的样本,这就导致一个问题:单模型对大场景预估更友好。如何兼顾各场景,提升模型个性化能力是…
-
开源人工智能语言模型的 10 个正面和负面影响
虽然 GPT 和 PaLM 等专有软件占据了市场主导地位,但是仍旧有很多开发人员看到了开源语言模型的价值。由于开源语言模型有很多优点和缺点,并且会对人工智能行业产生积极和消极的影响…
-
GPT-4易受提示注入攻击,导致虚假信息
译者 | 布加迪 审校 | 重楼 最近,ChatGPT以其GPT模型风靡全球,该模型可以对给定的任何输入提供类似人类的响应。它可以执行几乎任何与文本相关的任务,比如总结、翻译、角色…
-
华为与四大伙伴共同发布昇腾AI大模型训推一体化解决方案
昇腾人工智能产业高峰论坛在上海举办。论坛现场,大模型联合创新启动,26家行业领军企业、科研院所与华为将共同基于昇腾AI进行基础大模型与行业大模型应用创新。同时,华为携手伙伴联合发布…
-
达摩院发布大模型测试基准:GPT-4勉强及格,其他模型悉数落败
随着大模型的发展,尤其是近来各种开源大模型的发布,如何对各种模型进行充分并且准确的评估变得越来越重要。其中一个越来越受到认可的方向就是利用人类考题来检验模型,从而可以测试模型的知识…
-
如何低成本、便捷地使用大模型?看亚马逊云科技解锁生成式 AI 的方法
如今,我们进入到“百模大战”时代,科技公司纷纷推出自己的大模型,想在人工智能赛道上抢占先机。然而,大模型要想发挥更大的价值,还应更加深入千行百业,加速在实体产业落地,为社会创造更大…
-
54百亿参数大模型进化树重磅更新!85页盘点LLM发展史,附最详细prompt技巧
在4月一经推出就火爆开发者社区的大语言模型综述更新了! 此前,人大等学校的多位研究者回顾了大语言模型在背景知识、关键发现和主流技术等方面的进展,尤其强调了大语言模型的预训练、自适应…
-
谷歌更新隐私政策规定,可使用互联网上的公开信息训练 AI 模型
7 月 4 日消息,搜索引擎巨头谷歌近期更新了其隐私政策,将使用互联网上的公开信息训练 AI 模型。 图片 2 政策中提到,谷歌现可通过收集网络上的公开信息或来自其他公共来源的信息…
-
华为大模型登Nature正刊!审稿人:让人们重新审视预报模型的未来
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 比传统方法快1万倍、只需要1.4秒就能完成24小时全球气象预报——它就是来自华为云的盘古气象大模型。 …
-
MetaGPT AI 模型开源:可模拟软件公司开发过程,生成高质量代码
7 月 4 日消息,MetaGPT 是一个着重于代码生成的 AI 模型,虽然名字类似,但该模型并非 Meta 公司团队所开发,目前该模型已经在 GitHub 中开源。 据悉,Met…
-
第一个超越ChatGPT的开源模型来了?网友并不买账
大模型火了起来,每天我们都能看到各种「大」新闻。 图片 今天,又来了个 Big News:新开源的一个大模型超越了 ChatGPT。 具体是什么呢? OpenLLM 是一系列在极小…