模型
-
使用CLIP构建视频搜索引擎
CLIP(Contrastive Language-Image Pre-training)是一种机器学习技术,它可以准确理解和分类图像和自然语言文本,这对图像和语言处理具有深远的影…
-
首个目标检测扩散模型,比Faster R-CNN、DETR好,从随机框中直接检测
扩散模型( Diffusion Model )作为深度生成模型中的新 SOTA,已然在图像生成任务中超越了原 SOTA:例如 GAN,并且在诸多应用领域都有出色的表现,如计算机视觉…
-
达摩院预测的2023十大科技趋势,你看准哪个?
一个世纪以来,数字科技的演进推动了人类的技术进步与产业发展。我们当前正在经历数字科技最快发展的阶段,数字化、网络化、智能化让数字世界与物理世界的融合与协同更加紧密。 随着技术的不断…
-
让大模型的训练和推理,比更快还更快!谷歌2022年终总结第四弹
虽然谷歌的Bard翻车了,但谷歌的AI实力仍然不容小觑。 自开年以来,由Jeff Dean领衔的Google Research年终总结系列「Google Research, 202…
-
研究发现,人工智能语言模型 GPT-3 在智商测试中明显胜过人类大学生
1 月 9 日消息,2020 年 6 月,在训练约 2000 亿个单词、烧掉几千万美元后,史上最强大 AI 模型“生成型已训练变换模型 3”(GPT-3)一炮而红。 这个 Open…
-
机器学习评估指标的十个常见面试问题
评估指标是用于评估机器学习模型性能的定量指标。它们提供了一种系统和客观的方法来比较不同的模型并衡量它们在解决特定问题方面的成功程度。通过比较不同模型的结果并评估其性能可以对使用哪些…
-
阿里「杀手锏」级语音识别模型来了!推理效率较传统模型提升10倍,已开源
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 阿里达摩院,又搞事儿了。 这两天,它们发布了一个全新的语音识别模型: Paraformer。 开发人员…
-
无需人工标注,自生成指令框架打破ChatGPT等LLM的成本瓶颈
ChatGPT 是今年年底 AI 圈的新晋顶流,人们惊叹于它强大的问答语言能力和掌握的编程知识。但越是强大的模型,其背后的技术要求也就越高。 ChatGPT 是在 GPT 3.5…
-
首次将「教导主任」引入模型蒸馏,大规模压缩优于24种SOTA方法
面对越来越深的深度学习模型和海量的视频大数据,人工智能算法对计算资源的依赖越来越高。为了有效提升深度模型的性能和效率,通过探索模型的可蒸馏性和可稀疏性,本文提出了一种基于 “教导主…
-
毫末智行:自动驾驶认知大模型正式升级为DriveGPT
2月17日消息,毫末智行宣布自动驾驶认知大模型正式升级为DriveGPT,并将在2023年4月的HAOMO AI DAY上公布其最新重要进展。 随着ChatGPT火爆全网,它所采用…
-
Meta千亿参数大模型OPT-IML「升级版」来了,完整模型和代码公布!
今年五月,MetaAI官宣发布了基于1750亿参数的超大模型OPT-175B,还对所有社区免费开放。 12月22日,该模型的更新版本OPT-IML(Open Pre-trained…
-
ChatGPT爆火之后,视觉研究者坐不住了?谷歌将ViT参数扩大到220亿
与自然语言处理类似,对预训练视觉主干的迁移提高了模型在各种视觉任务上的性能。更大的数据集、可扩展的架构和新的训练方法都推动了模型性能的提升。 然而,视觉模型仍然远远落后于语言模型。…