gpu

单个GPU，只花一天时间，能把BERT训练成什么样

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。单个GPU，只花一天时间，能把BERT训练成什么样？现在，终于有研究人员做这件事了，在有限的计算条件…

冰咖啡
2023年7月16日 • 人工智能
000
一日一卡挑战：RTX2080Ti搞定大模型训练，算力节省136倍，学界欢呼

在一块消费级 GPU 上只用一天时间训练，可以得到什么样的 BERT 模型？最近一段时间，语言模型再次带火了 AI 领域。预训练语言模型的无监督训练属性使其可以在海量样本基础上进…

一粟
2023年7月16日 • 人工智能
000
消费级GPU成功运行1760亿参数大模型

在消费级 GPU 上运行大规模模型是机器学习社区正面临的挑战。语言模型的规模一直在变大，PaLM 有 540B 参数，OPT、GPT-3 和 BLOOM 有大约 176B 参数，…

8340
2023年7月15日 • 人工智能
000
系统设计的艺术：当HPC与AI应用成为主流，GPU架构该向何处去？

我们多年前就曾经提到，配合充足的数据并使用卷积神经网络进行AI工作负载训练正逐渐成为主流，而全球各主要HPC（高性能计算）中心多年来一直把这方面负载交给英伟达的GPU处理。对于模拟…

7898
2023年7月15日 • 人工智能
000
如何在GPU资源受限情况下微调超大模型

提问：模型大小超过GPU 容量怎么办？本文的灵感来自于Yandex数据分析学院教授的“高效深度学习系统”课程。预备知识：假设读者已经了解神经网络的前传递和后向传递的…

イ寸弓虽ぃ
2023年7月15日 • 人工智能
000
仅需1% Embedding参数，硬件成本降低十倍，开源方案单GPU训练超大推荐模型

深度推荐模型（DLRMs）已经成为深度学习在互联网公司应用的最重要技术场景，如视频推荐、购物搜索、广告推送等流量变现业务，极大改善了用户体验和业务商业价值。但海量的用户和业务数据，…

2159
2023年7月15日 • 人工智能
000
前端后端

QLoRa：在消费级GPU上微调大型语言模型

大多数大型语言模型(LLM)都无法在消费者硬件上进行微调。例如，650亿个参数模型需要超过780 Gb的GPU内存。这相当于10个A100 80gb的gpu。就算我们使用云服务器，…

9682
2023年7月15日
000
前端后端

FPGA对比GPU，优劣势与应用场景分析

1 引言全球领先的半导体公司AMD（AMD）在2021年以350亿美元收购了芯片制造商Xilinx（XLNX），这是AMD继收购ATI Technologies以来的又一次重大收…

菊花从此为君开
2023年7月15日
000
前端后端

FPGA对比GPU，优劣势与应用场景分析

全球领先的半导体公司AMD（AMD）在2021年以350亿美元收购了芯片制造商Xilinx（XLNX），这是AMD继收购ATI Technologies以来的又一次重大收购。不过，…

cmcc
2023年7月14日
000
关于GPU场景与局限性

GPU作为一种协处理器，传统用途主要是处理图像类并行计算任务；计算机系统面对的计算任务有着复杂而不同的性能要求，当 CPU 无法满足特定处理任务时，则需要一个针对性的协处理器辅助计…

cmcc
2023年3月6日 • 前端后端
000
2023「炼丹」GPU选购指南来了：英伟达3080和4070Ti成性价比之王

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。,春暖花开，各位深度学习er想不想给自己的“丹炉”升级一波？,“炼丹”爱好者们应该知道，在该领域中，**…

cmcc
2023年3月6日 • 前端后端
000
系统工具

GPU-Z v2.41 官方汉化中文版

软件介绍 GPU-Z 是一个轻量级系统实用程序，旨在提供有关视频卡和图形处理器的重要信息。界面直观，运行后即可显示GPU核心，以及运行频率、带宽等，GPU-Z绿色中文版，使用起来更…

汇维网
2021年8月7日
010

3 / 3
1
2
3