图像

人工智能

使用TensorFlow训练图像分类模型的指南

译者 | 陈峻审校 | 孙淑娟众所周知，人类在很小的时候就学会了识别和标记自己所看到的事物。如今，随着机器学习和深度学习算法的不断迭代，计算机已经能够以非常高的精度，对捕获到的…

QQ企鹅
2023年7月16日
000
图像预处理库CV-CUDA开源了，打破预处理瓶颈，提升推理吞吐量20多倍

在如今信息化时代中，图像或者说视觉内容早已成为日常生活中承载信息最主要的载体，深度学习模型凭借着对视觉内容强大的理解能力，能对其进行各种处理与优化。然而在以往的视觉模型开发与应用中…

Mr
2023年7月16日 • 人工智能
000
Transformer再胜Diffusion！谷歌发布新一代文本-图像生成模型Muse：生成效率提升十倍

最近谷歌又发布了全新的文本-图像生成Muse模型，没有采用当下大火的扩散（diffusion）模型，而是采用了经典的Transformer模型就实现了最先进的图像生成性能，相比扩散…

3652
2023年7月16日 • 人工智能
000
扩散+超分辨率模型强强联合，谷歌图像生成器Imagen背后的技术

近年来，多模态学习受到重视，特别是文本 – 图像合成和图像 – 文本对比学习两个方向。一些 AI 模型因在创意图像生成、编辑方面的应用引起了公众的广泛关注，…

1486
2023年7月15日 • 人工智能
000
自动驾驶方向开源数据集资源汇总

城市景观图像对数据集数据集下载地址：http://m6z.cn/6qBe8e 城市景观数据（数据集主页）包含从德国驾驶的车辆中拍摄的标记视频。此版本是作为 Pix2Pix 论文…

7360
2023年7月15日 • 人工智能
000
英伟达：从图像中抽象出概念再生成新的图像，网友：人类幼崽这个技能AI终于学会了

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。早在2017年，就有网友吐槽：2岁幼童只要见过一次犀牛的照片，就能在其他图片里认出不同姿势、视角和风格…

9731
2023年7月15日 • 人工智能
000
多模态图像合成与编辑这么火，马普所、南洋理工等出了份详细综述

近期 OpenAI 发布的 DALLE-2 和谷歌发布的 Imagen 等实现了令人惊叹的文字到图像的生成效果，引发了广泛关注并且衍生出了很多有趣的应用。而文字到图像的生成属于多模…

9568
2023年7月15日 • 人工智能
000
Stable Diffsuion还能用来压缩图像？压缩率更高，清晰度超越JPEG等算法

基于文本的图像生成模型火了，出圈的不止有扩散模型，还有开源的Stable Diffusion模型。最近一位瑞士的软件工程师Matthias Bühlmann无意间发现，Stabl…

8023
2023年7月15日 • 人工智能
000
ICRA 2022杰出论文：把自动驾驶2D图像转成鸟瞰图，模型识别准确率立增15%

对于自动驾驶中的许多任务来说，从自上而下、地图或鸟瞰 (BEV) 几个角度去看会更容易完成。由于许多自动驾驶主题被限制在地平面，所以俯视图是一种更实用的低维表征，对于导航也更加理想…

7360
2023年7月15日 • 人工智能
000
深度学习又有新坑了！悉尼大学提出全新跨模态任务，用文本指导图像进行抠图

图像抠图是指提取图像中准确的前景。当前的自动方法倾向于不加区别地提取图像中的所有显著对象。在本文中，作者提出了一个新的任务称为参考图像抠图 (Referring Ima…

恭喜发财
2023年7月15日 • 人工智能
000
用于图像翻译的五种最有前途的 AI 模型

图像到图像的翻译根据Solanki、Nayyar和Naved在论文中提供的定义，图像到图像的翻译是将图像从一个域转换到另一个域的过程，其目标是学习输入图像和输出图像之间的映射。 …

风和日丽
2023年7月15日 • 人工智能
000
人工智能

硅谷押注，生成式AI火了，让你把简单文字变成图像甚至视频

最近几年兴起的所谓“生成式人工智能（generative AI）”正吸引硅谷科技巨头和风投机构的兴趣，这种 AI 可以依据少量词汇在几秒钟内生成与之相匹配的图像。分析师预计，这种技…

7336
2023年7月15日
000

6 / 8
3
4
5
6
7
8