视频
-
人们拿ChatGPT自动写邮件,微软Salesforce都开始集成类似功能
3月9日消息,不少人已经开始用人工智能聊天机器人自动撰写各种电子邮件文稿。这表明,随着Salesforce和微软等公司将人工智能聊天机器人与软件紧密集成,ChatGPT等人工智能…
-
CV CUDA在微博多媒体内容理解的应用
一、微博多媒体内容理解的背景介绍 首先和大家分享多媒体内容理解的背景,多媒体内容主要包含视频,音频,图像和文本的理解。在视频的理解里边,有很多非常重要也非常基础的一些工…
-
无人车传感器全部「失效」,还能畅行城市道路,背后黑科技火出海外
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 “马斯克,你相信V2X+AI能让自动驾驶更容易落地吗?” 这两天,海外很多科技知名UP主,如Karl …
-
时间、空间可控的视频生成走进现实,阿里大模型新作VideoComposer火了
在 AI 绘画领域,阿里提出的 Composer 和斯坦福提出的基于 Stable diffusion 的 ControlNet 引领了可控图像生成的理论发展。但是,业界在可控视频…
-
给语言大模型加上综合视听能力,达摩院开源Video-LLaMA
视频在当今社交媒体和互联网文化中扮演着愈发重要的角色,抖音,快手,B 站等已经成为数以亿计用户的热门平台。用户围绕视频分享自己的生活点滴、创意作品、有趣瞬间等内容,与他人互动和交流…
-
图片+音频秒变视频!西交大开源SadTalker:头、唇运动超自然,中英双语全能,还会唱歌
随着数字人概念的火爆、生成技术的不断发展,让照片里的人物跟随音频的输入动起来也不再是难题。 不过目前「通过人脸图像和一段语音音频来生成会说话的人物头像视频」仍然存在诸多问题,比如头…
-
小伙用 AI“复活”奶奶,聊家常对答如流
4 月 10 日消息,近日,一段小伙用 AI“复活”已故奶奶的视频在网上引发了热议。视频显示,小伙通过导入奶奶的照片和音频,利用 AI 技术制作出了奶奶的动态头像和声音,并与之进行…
-
无人车传感器全部「失效」,还能畅行城市道路,背后黑科技火出海外
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 “马斯克,你相信V2X+AI能让自动驾驶更容易落地吗?” 这两天,海外很多科技知名UP主,如Karl …
-
人手一部「小电影」!视频版Midjourney免费可用,一句话秒生酷炫大片惊呆网友
翘首以盼了三个月,Runway的Gen-2终于可以免费体验了! 可以说,这是AI视频工具发展史上值得载入史册的一天。 试用地址:https://app.runwayml.com 这…
-
Web 端实时防挡脸弹幕(基于机器学习)
防挡脸弹幕,即大量弹幕飘过,但不会遮挡视频画面中的人物,看起来像是从人物背后飘过去的。 机器学习已经火了好几年了,但很多人都不知道浏览器中也能运行这些能力; 本文介绍在视频弹幕方面…
-
南科大黑科技:一键消除视频人物,特效师的救星来了!
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 来自南方科技大学的这款视频分割模型,可以追踪视频中的任意事物。 不仅会“看”,还会“剪”,从视频中去掉…
-
随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了
前段时间,Meta 发布「分割一切(SAM)」AI 模型,可以为任何图像或视频中的任何物体生成 mask,让计算机视觉(CV)领域研究者惊呼:「CV 不存在了」。之后,CV 领域掀…