模型
-
斯坦福/谷歌大脑:两次蒸馏,引导扩散模型采样提速256倍!
最近,无分类器的指导扩散模型(classifier-free guided diffusion models)在高分辨率图像生成方面非常有效,并且已经被广泛用于大规模扩散框架,包括…
-
连续迁移学习跨域推荐排序模型在淘宝推荐系统的应用
本文探讨了如何在工业界的连续学习的框架下实现跨域推荐模型,提出了连续迁移学习这一新的跨域推荐范式,利用连续预训练的源域模型的中间层表征结果作为目标域模型的额外知识,设计了一个轻量级…
-
人人都能用的多语种大语言模型来了!支持59种语言,参数1760亿
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 一直以来,很多大模型都由造它们出来的大型私营科技公司垄断着。 比如GPT-3等,对于普通人来说,再香也…
-
EasyNLP中文文图生成模型带你秒变艺术家
多模态数据(文本、图像、声音)是人类认识、理解和表达世间万物的重要载体。近年来,多模态数据的爆炸性增长促进了内容互联网的繁荣,也带来了大量多模态内容理解和生成的需求。与常见的跨模态…
-
南洋理工提出全场景图生成PSG任务,像素级定位物体,还得预测56种关系
现在已经2022年了,但是当下大多数的计算机视觉任务却仍然只关注于图像感知。比如说,图像分类任务只需要模型识别图像中的物体物体类别。虽然目标检测,图像分割等任务进一步要求找到物体的…
-
机器学习天降福音!数据科学家、Kaggle大师发布「ML避坑宝典」
数据科学和机器学习正变得越来越流行。 进入这个领域的人数,每天都在增长。 这意味着,很多数据科学家在构建第一个机器学习模型时,并没有丰富的经验,所以很容易发生错误。 以下就是机器…
-
教大模型自己跳过“无用”层,推理速度×3性能不变,谷歌MIT这个新方法火了
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 大语言模型用着爽,但推理速度实在太慢了? 而且,增加模型体积,推理效果也并不一定就比之前更好。 为了解…
-
MLFlow打包和部署机器学习模型实战
译者 | 朱先忠 审校 | 孙淑娟 简介 ML模型生命周期开发每个阶段的基本活动之一是协作。从ML模型的概念到部署,需要构建模型所涉及的不同角色之间的参与和交互。此外,ML模型开…
-
NLPer内部巨大分歧!美国三所顶尖大学发布调查报告:62%从业者认同寒冬正来临
自然语言理解(NLP)素有人工智能皇冠上的明珠的盛誉,在大规模语言模型的加持下,人类也终于有了让计算机理解语言的能力。 但这个「理解」还是得打个引号,按目前NLP模型的效果来看,虽…
-
如何确保用于训练机器学习模型的数据安全?
网络犯罪分子远程操纵和对机器学习模型性能产生负面影响并不难。 恶意用户可以毒害机器学习的训练数据,非法访问训练数据集中的敏感用户信息,并导致类似的其他问题。 机器学习和人工智能的采…
-
研究表明大型语言模型在逻辑推理方面存在问题
译者 | 李睿 审校 | 孙淑娟 在具有感知功能的聊天机器人成为热门话题之前,大型语言模型(LLM)就已经引起了人们更多的兴奋和担忧。近年来,经过大量文本训练的深度学习模型——大型…
-
只需训练一次,即可生成3D新场景!谷歌「光场神经渲染」进化史
视图合成(view synthesis)是计算机视觉和计算机图形学交叉领域的一个重点难题,指的是从一个场景的多张图片中创建该场景的新视图。 要准确地合成一个场景的新视图,一个模型需…