图像
-
使用TensorFlow训练图像分类模型的指南
译者 | 陈峻 审校 | 孙淑娟 众所周知,人类在很小的时候就学会了识别和标记自己所看到的事物。如今,随着机器学习和深度学习算法的不断迭代,计算机已经能够以非常高的精度,对捕获到的…
-
图像预处理库CV-CUDA开源了,打破预处理瓶颈,提升推理吞吐量20多倍
在如今信息化时代中,图像或者说视觉内容早已成为日常生活中承载信息最主要的载体,深度学习模型凭借着对视觉内容强大的理解能力,能对其进行各种处理与优化。然而在以往的视觉模型开发与应用中…
-
Transformer再胜Diffusion!谷歌发布新一代文本-图像生成模型Muse:生成效率提升十倍
最近谷歌又发布了全新的文本-图像生成Muse模型,没有采用当下大火的扩散(diffusion)模型,而是采用了经典的Transformer模型就实现了最先进的图像生成性能,相比扩散…
-
扩散+超分辨率模型强强联合,谷歌图像生成器Imagen背后的技术
近年来,多模态学习受到重视,特别是文本 – 图像合成和图像 – 文本对比学习两个方向。一些 AI 模型因在创意图像生成、编辑方面的应用引起了公众的广泛关注,…
-
自动驾驶方向开源数据集资源汇总
城市景观图像对数据集 数据集下载地址:http://m6z.cn/6qBe8e 城市景观数据(数据集主页)包含从德国驾驶的车辆中拍摄的标记视频。此版本是作为 Pix2Pix 论文…
-
英伟达:从图像中抽象出概念再生成新的图像,网友:人类幼崽这个技能AI终于学会了
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 早在2017年,就有网友吐槽:2岁幼童只要见过一次犀牛的照片,就能在其他图片里认出不同姿势、视角和风格…
-
多模态图像合成与编辑这么火,马普所、南洋理工等出了份详细综述
近期 OpenAI 发布的 DALLE-2 和谷歌发布的 Imagen 等实现了令人惊叹的文字到图像的生成效果,引发了广泛关注并且衍生出了很多有趣的应用。而文字到图像的生成属于多模…
-
Stable Diffsuion还能用来压缩图像?压缩率更高,清晰度超越JPEG等算法
基于文本的图像生成模型火了,出圈的不止有扩散模型,还有开源的Stable Diffusion模型。 最近一位瑞士的软件工程师Matthias Bühlmann无意间发现,Stabl…
-
ICRA 2022杰出论文:把自动驾驶2D图像转成鸟瞰图,模型识别准确率立增15%
对于自动驾驶中的许多任务来说,从自上而下、地图或鸟瞰 (BEV) 几个角度去看会更容易完成。由于许多自动驾驶主题被限制在地平面,所以俯视图是一种更实用的低维表征,对于导航也更加理想…
-
深度学习又有新坑了!悉尼大学提出全新跨模态任务,用文本指导图像进行抠图
图像抠图是指提取图像中准确的前景。当前的自动方法倾向于不加区别地提取图像中的所有显著对象。在本文中,作者提出了一个新的任务称为 参考图像抠图 (Referring Ima…
-
用于图像翻译的五 种最有前途的 AI 模型
图像到图像的翻译 根据Solanki、Nayyar和Naved在论文中提供的定义,图像到图像的翻译是将图像从一个域转换到另一个域的过程,其目标是学习输入图像和输出图像之间的映射。 …
-
硅谷押注,生成式AI火了,让你把简单文字变成图像甚至视频
最近几年兴起的所谓“生成式人工智能(generative AI)”正吸引硅谷科技巨头和风投机构的兴趣,这种 AI 可以依据少量词汇在几秒钟内生成与之相匹配的图像。分析师预计,这种技…