视觉
-
小扎亲自官宣Meta视觉大模型!自监督学习无需微调,多任务效果超OpenCLIP
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 无需文字标签,完全自监督的Meta视觉大模型来了! 小扎亲自官宣,发布即收获大量关注度—— 在语义分割…
-
Meta研究员创造出人工视觉皮层,可以让机器人通过视觉进行操作
Meta公司AI研究部门的研究人员日前发布一项公告,宣布在机器人自适应技能协调和视觉皮层复制方面取得关键进展。他们表示,这些进展允许AI驱动的机器人通过视觉在现实世界中操作,并且不…
-
自动驾驶视觉感知算法技术综述
环境感知 是自动驾驶的第一环,是车辆和环境交互的纽带。一个自动驾驶系统整体表现的好坏,很大程度上都取决于感知系统的好坏。目前,环境感知技术有两大主流技术路线: ①以视觉为主导的多传…
-
加速ViT模型新思路!Meta推出Token Merging,不靠剪枝靠合并
视觉变换器(ViT)在两年前进入大众视野,并成为计算机视觉研究的核心组成部分。 它成功将一个在自然语言处理领域的Transformer模型迁移到计算机视觉领域。从那时起,计算机视觉…
-
用AI让数亿失明者重新「看见世界」!
以前,让失明者重见光明往往被视为一种医学「奇迹」。 而随着以「机器视觉+自然语言理解」为代表的多模态智能技术的爆发式突破,给AI助盲带来新的可能,更多的失明者将借助AI提供的感知、…
-
ConvNeXt V2来了,仅用最简单的卷积架构,性能不输Transformer
经过几十年的基础研究,视觉识别领域已经迎来了大规模视觉表征学习的新时代。预训练的大规模视觉模型已经成为特征学习(feature learning)和视觉应用的基本工具。视觉表征学习…
-
Meta推出MoDem世界模型:解决视觉领域三大挑战,LeCun转发
12月27日,MetaAI 负责视觉和强化学习领域的A 截止27日晚间,这篇推文的阅读量已经达到73.9k。 他表示,仅给出5个演示,MoDem就能在100K交互步骤中解决具有稀疏…
-
两亿台摄像头将智能机器视觉推向边缘
机器视觉(MV)使用的技术使工业机器能够“看到”和分析任务,并根据系统看到的内容做出快速决策。MV正在迅速成为自动化中最核心的技术之一。 鉴于现在这项技术正在与机器学习(ML)合并…
-
元宇宙如何“喂养”人工智能模型?
视觉世界由许多包含多种数据类型、接口和人工智能模型的移动部件组成。3D界面包含了时间和空间相关属性的许多数据类型,它们对于捕获和分析过去趋势、预测未来发展趋势非常重要。 这种视觉…
-
ChatGPT爆火之后,视觉研究者坐不住了?谷歌将ViT参数扩大到220亿
与自然语言处理类似,对预训练视觉主干的迁移提高了模型在各种视觉任务上的性能。更大的数据集、可扩展的架构和新的训练方法都推动了模型性能的提升。 然而,视觉模型仍然远远落后于语言模型。…
-
利用计算机视觉提高商业系统的安全性
保护企业资产和信息以及确保团队成员的安全应该是任何企业的两个最高优先级。据BusinessWire称,到2025年,调查和安全服务市场的价值将攀升至4171.6亿美元。但是,由于复…
-
智慧农业:计算机视觉和机器人正被用于提高效率
农业中的人工智能有助于检测农场中的害虫、植物病害和营养不良。人工智能传感器可以识别并锁定杂草,然后再决定在该地区使用哪种除草剂。精准农业,通常被称为人工智能系统,正在帮助提高收获的…